scholarly journals Content-based information retrieval and anonymisation in data and multimedia streams

2018 ◽  
Author(s):  
Αθανάσιος Ζυγομήτρος

Προσωπικά δεδομένα είναι οποιαδήποτε πληροφορία μπορεί να χρησιμοποιηθεί για την αναγνώριση ενός ατόμου. Αυτά τα δεδομένα μπορούν να λάβουν διάφορες μορφές, όπως ένα πεδίο σε μια βάση δεδομένων, έναν μοναδικό αριθμό, μια φωτογραφία ή ένα πακέτο δικτύου. Τα προσωπικά δεδομένα σχετικά με τα άτομα συλλέγονται και διαχειρίζονται από οργανισμούς στον ιδιωτικό και δημόσιο τομέα. Οι επιχειρήσεις και η επιστημονική κοινότητα έχουν μια ακόρεστη δίψα για δεδομένα. Με τους προηγμένους αλγόριθμους εξόρυξης δεδομένων νέα γνώση μπορεί να αποκαλυφθεί από αυτά τα δεδομένα. Πρέπει να σημειωθεί ότι αυτά τα δεδομένα δεν μπορούν να δημοσιευθούν χωρίς την δέουσα προσοχή αφού υπάρχει πάντα ο κίνδυνος παραβίασης της ιδιωτικής ζωής των ατόμων. Ένας επιστημονικός τομέας αναδείχθηκε, αυτός της ανωνυμοποίησης δεδομένων, για να καλύψει την ανάγκη της προστασίας της ιδιωτικότητας σε δεδομένα που δημοσιεύονται. Η διαδικασία της ανωνυμοποίησης θα πρέπει να εξισορροπήσει την προστασία της ιδιωτικότητας των ατόμων με τη χρησιμότητα του δημοσιευμένου συνόλου δεδομένων. Αυτές οι τεχνικές ανωνυμοποίησης αναλύονται και παρουσιάζονται τα πλεονεκτήματα και μειονεκτήματα τους. Η συμβολή αυτής της διατριβής στο επιστημονικό πεδίο της δημοσίευσης δεδομένων είναι διττή. Πρώτον, την εισαγωγή μιας νέας επίθεσης σε ανωνυμοποιημένα δεδομένα, που ονομάζεται επίθεση συμπερασμού των οιονεί αναγνωριστικών, inference of QI attack, που δείχνει ότι μια αυτοματοποιημένη λύση ανωνυμοποίησης, ειδικά για ιατρικά δεδομένα, είναι δύσκολο να επιτευχθεί χωρίς να ληφθεί υπόψη η σημασιολογία των δεδομένων και χωρίς την συμβολή των εμπειρογνωμόνων του τομέα. Δεύτερον, η ανάπτυξη ενός νέου αλγορίθμου που υλοποιεί km-anonymisation λαμβάνοντας υπόψη τις ιδιότητες των συνεχών χαρακτηριστικών και χωρίς να προαπαιτεί μια ιεραρχία γενίκευσης. Μετά από διεξαγωγή πειραμάτων φαίνεται ότι ο νέος αλγόριθμός διατηρεί περισσότερες πληροφορίες στο δημοσιευμένο σύνολο δεδομένων σε σύγκριση με άλλους αλγόριθμους ανωνυμοποίησης που χρησιμοποιούν ιεραρχίες γενίκευσης. Τα πολυμέσα είναι ένας άλλος τύπος προσωπικών δεδομένων που επίσης εξετάστηκε σε αυτή την έρευνα. Συγκεκριμένα από τα πολυμέσα που διαμοιράζονται στα Online Κοινωνικά Δίκτυα προκύπτουν πολλοί κίνδυνοι ιδιωτικότητας. Παρουσιάζεται μια αναλυτική έρευνα για τους κινδύνους αυτούς και προτείνεται μια λύση με βάση την ψηφιακή υδατογράφηση για την εξάλειψη πολλών από αυτούς τους κινδύνους. Τα έξυπνα τηλέφωνα με την συνεχώς αυξανόμενη υπολογιστική δύναμη συνδυάζονται με αισθητήρες, όπως το GPS, προσφέροντας νέες ευκαιρίες για ανάπτυξη κινητών εφαρμογών με νέες δυνατότητες. Για να δείξουμε πώς μπορεί να παραβιαστεί το απόρρητο ενός χρήστη, επικεντρώσαμε την προσοχή μας σε έναν τομέα ευαίσθητο στην ιδιωτικότητα των εφαρμογών, των εφαρμογών που χρονολογούνται. Η έρευνα βασίζεται στα μεταδιδόμενα πακέτα δικτύου και τα αποτελέσματα είναι ανησυχητικά.

Author(s):  
Richard E. Hartman ◽  
Roberta S. Hartman ◽  
Peter L. Ramos

We have long felt that some form of electronic information retrieval would be more desirable than conventional photographic methods in a high vacuum electron microscope for various reasons. The most obvious of these is the fact that with electronic data retrieval the major source of gas load is removed from the instrument. An equally important reason is that if any subsequent analysis of the data is to be made, a continuous record on magnetic tape gives a much larger quantity of data and gives it in a form far more satisfactory for subsequent processing.


Author(s):  
Hilton H. Mollenhauer

Many factors (e.g., resolution of microscope, type of tissue, and preparation of sample) affect electron microscopical images and alter the amount of information that can be retrieved from a specimen. Of interest in this report are those factors associated with the evaluation of epoxy embedded tissues. In this context, informational retrieval is dependant, in part, on the ability to “see” sample detail (e.g., contrast) and, in part, on tue quality of sample preservation. Two aspects of this problem will be discussed: 1) epoxy resins and their effect on image contrast, information retrieval, and sample preservation; and 2) the interaction between some stains commonly used for enhancing contrast and information retrieval.


Author(s):  
Fox T. R. ◽  
R. Levi-Setti

At an earlier meeting [1], we discussed information retrieval in the scanning transmission ion microscope (STIM) compared with the electron microscope at the same energy. We treated elastic scattering contrast, using total elastic cross sections; relative damage was estimated from energy loss data. This treatment is valid for “thin” specimens, where the incident particles suffer only single scattering. Since proton cross sections exceed electron cross sections, a given specimen (e.g., 1 μg/cm2 of carbon at 25 keV) may be thin for electrons but “thick” for protons. Therefore, we now extend our previous analysis to include multiple scattering. Our proton results are based on the calculations of Sigmund and Winterbon [2], for 25 keV protons on carbon, using a Thomas-Fermi screened potential with a screening length of 0.0226 nm. The electron results are from Crewe and Groves [3] at 30 keV.


Planta Medica ◽  
2015 ◽  
Vol 81 (16) ◽  
Author(s):  
EA Dauncey ◽  
J Irving ◽  
N Black ◽  
SE Edwards ◽  
K Patmore ◽  
...  

1967 ◽  
Vol 06 (02) ◽  
pp. 45-51 ◽  
Author(s):  
A. Kent ◽  
J. Belzer ◽  
M. Kuhfeerst ◽  
E. D. Dym ◽  
D. L. Shirey ◽  
...  

An experiment is described which attempts to derive quantitative indicators regarding the potential relevance predictability of the intermediate stimuli used to represent documents in information retrieval systems. In effect, since the decision to peruse an entire document is often predicated upon the examination of one »level of processing« of the document (e.g., the citation and/or abstract), it became interesting to analyze the properties of what constitutes »relevance«. However, prior to such an analysis, an even more elementary step had to be made, namely, to determine what portions of a document should be examined.An evaluation of the ability of intermediate response products (IRPs), functioning as cues to the information content of full documents, to predict the relevance determination that would be subsequently made on these documents by motivated users of information retrieval systems, was made under controlled experimental conditions. The hypothesis that there might be other intermediate response products (selected extracts from the document, i.e., first paragraph, last paragraph, and the combination of first and last paragraph), that would be as representative of the full document as the traditional IRPs (citation and abstract) was tested systematically. The results showed that:1. there is no significant difference among the several IRP treatment groups on the number of cue evaluations of relevancy which match the subsequent user relevancy decision on the document;2. first and last paragraph combinations have consistently predicted relevancy to a higher degree than the other IRPs;3. abstracts were undistinguished as predictors; and4. the apparent high predictability rating for citations was not substantive.Some of these results are quite different than would be expected from previous work with unmotivated subjects.


Sign in / Sign up

Export Citation Format

Share Document