Top Banner
1/11 Α.Π.Θ. Θεολογική σχολή Τμῆμα Θεολογίας Ἀλέξανδρος Ξαφόπουλος Α.Ε.Μ. 9456, πτυχίο 2005 email: alexandroc@theo.auth.gr Θεσσαλονίκη, Φεβρουάριος 2012 Ἐργασία γιά τό μάθημα (ἐπιλογῆς) Ψηφιακή Διαχείριση Πληροφορίας. Σχεδίαση Ἱστοσελίδων καί Ψηφιακές Ἐκδόσεις μέ θέμα Μετάφραση τοῦ κεφαλαίου 11 τοῦ βιβλίου «Internet Measurement: Infrastructure, Traffic and Applications» Διδάσκων: Νικόλαος Μυρίδης
11

Μετάφραση τοῦ κεφαλαίου 11 τοῦ βιβλίου «Internet Measurement: Infrastructure, Traffic and Applications» [Translation of chapter 11 of the book «Internet

Jan 19, 2023

Download

Documents

Karen Evans
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Μετάφραση τοῦ κεφαλαίου 11 τοῦ βιβλίου «Internet Measurement: Infrastructure, Traffic and Applications» [Translation of chapter 11 of the book «Internet

111

ΑΠΘ

Θεολογική σχολή

Τμῆμα Θεολογίας

Ἀλέξανδρος Ξαφόπουλος

ΑΕΜ 9456 πτυχίο 2005

email alexandroctheoauthgr

Θεσσαλονίκη Φεβρουάριος 2012

Ἐργασία γιά τό μάθημα (ἐπιλογῆς)

Ψηφιακή Διαχείριση Πληροφορίας Σχεδίαση Ἱστοσελίδων καί Ψηφιακές Ἐκδόσεις

μέ θέμα

Μετάφραση τοῦ κεφαλαίου 11 τοῦ βιβλίου laquoInternet Measurement Infrastructure Traffic and Applicationsraquo

Διδάσκων Νικόλαος Μυρίδης

211

ΕΙΣΑΓΩΓΗ

Ἡ παροῦσα ἐργασία ἀποτελεῖ μία προσπάθεια μετάφρασης τοῦ ἐνδεκάτου κεφαλαίου τοῦ βιβλίου laquoInternet Measurement Infrastructure Traffic and Applicationsraquo1 Γιά ἀρκετούς ὄρους χρησιμοποιήθηκε τό λεξικό ΜΑΤΖΕΝΤΑ2

ΜΕΤΑΦΡΑΣΗ 11 Συμπεράσματα και Προοπτικές

Σε αυτό το κεφάλαιο αποσκοπούμε να συνθέσουμε πολλές πλευρές της Διαδικτυακής μέτρησης για να κατανοήσουμε από πού προήλθε το πεδίο και πού πηγαίνει Για να το κάνουμε πρώτα εξετάζουμε ευρείες τάσεις και επιτεύγματα που μπορούν να παρατηρηθούν σε παρελθοντικές προσπάθειες μέτρησης έπειτα εξετάζουμε τι προκλήσεις είναι σημαντικότερες στο να μετρηθεί το Διαδίκτυο σήμερα και τελικά εξετάζουμε το πώς παρελθοντικές καθώς και τελευταία αναπτυγμένες τάσεις είναι πιθανό να διαμορφώσουν τη Διαδικτυακή μέτρηση στο μέλλον

111 Τάσεις στη Διαδικτυακή Μέτρηση

Είδαμε ότι το Διαδίκτυο έχει μετρηθεί με ποικίλους τρόπους από την έναρξή του ως ARPANET το 1969 Υπήρξε ένας αριθμός τάσεων που επηρέασαν τον τρόπο μέτρησης του Διαδικτύου κατά αυτήν τη χρονική διάρκεια Κάποιες τάσεις είναι τεχνολογικές η Διαδικτυακή τεχνολογία έχει αλλάξει με το χρόνο (πράγμα) το οποίο έχει κάνει κάποιες μετρήσεις να γίνουν δυσκολότερες και κάποιες μετρήσεις ευκολότερες Αλλές τάσεις είναι θέμα κλιμάκωσης η τεράστια αύξηση του Διαδικτύου έχει αλλάξει αυτό που είναι πρακτικά μετρήσιμο και έχει πυροδοτήσει την ανάπτυξη νέων μεθόδων μέτρησης Και κάποιες τάσεις είναι κοινωνικές η μετάβαση τού Διαδικτύου από κυβερνητική επιδότηση σε ιδιωτική λειτουργία και η οικονομική σημασία της Διαδικτυακής επικοινωνἰας έχουν αλλάξει τα είδη των αναγκαίων μετρήσεων και το βαθμό στον οποίο μπορούν να γίνουν ορισμένες μετρήσεις

Η αλληλεπίδραση αυτών των τάσεων με το χρόνο έχει καταλήξει σε κάποια ευρέως αναγνωρίσιμα επιτεύγματα στη φύση και την εστίαση της Διαδικτυακής μέτρησης Στο υπόλοιπο αυτής της ενότητας θα επιθεωρήσουμε κάποια από τα πιο εξέχοντα χαρακτηριστικά του τι η Διαδικτυακή μέτρηση έχει κατορθώσει με το χρόνο

Μετρήσεις ARPANET 1969-1975 Ενώ η κύρια ώθηση πίσω από την αρχική ανάπτυξη του ARPANET ήταν να συνδέσει ερευνητές με απομακρυσμένους υπολογιστές μια σημαντική σχετική ερώτηση ήταν η διερεύνηση της εφικτότητας και χρησιμότητας των αρχών εναλλαγής πακέτων Σαν αποτέλεσμα οι πρώτοι κόμβοι ARPANET (καλούμενοι Επεξεργαστές Διαπροσωπικών Μηνυμάτων (Interface Message Processors - IMPs)) σχεδιάστηκαν και φτιάχτηκαν με εκτεταμένες ενσωματωμένες δυνατότητες αυτομέτρησης όπως περιγράφεται στο [KN74] Αυτά τα χαρακτηριστικά περιέλαβαν την ικανότητα να ιχνηλατήσουν το πέρασμα ενός μόνου πακέτου διαμέσου του δικτύου την ικανότητα να

1 (Crovella M 2006) 2 Αγγλοελληνικό amp Ελληνοαγγλικό λεξικό ΧΡΥΣΗ ΕΚΔΟΣΗ ΜΑΤΖΕΝΤΑ

311

μετρήσουν απευθείας την κυκλοφοριακή ροή μεταξύ δύο οποιονδήποτε κόμβων και την ικανότητα να ρωτήσουν δρομολογητές για τα άμεσα στατιστικά του φορτίου εργασίας τους Ὀπως έχουμε δει στα Κεφάλαια 5 και 6 αυτά τα είδη χαρακτηριστικών είτε λείπουν ή είναι πολύ δύσκολο να χρησιμοποιηθούν στο σημερινό Διαδίκτυο

Τι συνέβη Καθώς το ARPANET αυξήθηκε έχασε τις περισσότερες εγγενείς δυνατότητες μέτρησης Μέχρι το 1975 οι δικτυακές μετρήσεις συντονίστηκαν και συλλέχθηκαν σε ένα μόνο Κέντρο Δικτυακής Μέτρησης (Network Measurement Center - NMC)) στο UCLA Μετά το 1975 ο διαχειριστικός έλεγχος του ARPANET αναλήφθηκε από την Αμυντική Υπηρεσία Επικοινωνιών και οι εκτενής μετρήση του ARPANET έπαυσε Ταυτόχρονα μια νέα γενιά από IMP αναπτύχθηκε και αυτοί ίσως να μην περιείχαν τις ίδιες ενσωματωμένες δυνατότητες μέτρησης που οι αρχικοί IMP κατείχαν

Η εξέλιξη του δικτύου μακρυά από την εκτενή αυτομέτρηση φαίνεται να έχει αναπτυχθεί για πολλούς λόγους Το δίκτυο αυξανόταν σε μέγεθος και η λειτουργία του γινόταν πιο προσανατολισμένη στην παροχή συνδεσιμότητας από ότι στην υποστήριξη έρευνας εναλλαγής πακέτων Από την άλλη πλευρά το δίκτυο δεν ήταν τόσο μεγάλο ώστε να χρειάζεται εκτενής μέτρηση για λειτουργικούς σκοπούς Τελικά η ενσωματωμένη αυτομέτρηση καθιστά συνθετότερη τη σχεδίαση και ακριβότερες τις δικτυακές συσκευές το οποίο ίσως να ήταν ένας παράγοντας επίσης

Λειτουργικές Μετρήσεις Μέχρι τα μέσα του 1980 το δίκτυο μεγάλωνε και πολλοί ανεξάρτητοι οργανισμοί αγόραζαν δικτυακό εξοπλισμό που χρειάζονταν για να λειτουργούν και να διοικούν Γινόταν φανερό ότι χρειαζόταν μία πρότυπη δυνατότητα παρακολούθησης Μία ποικιλία εταιρειών κατασκεύαζε Διαδικτυακό υλικό για εμπορική πώληση και χρειαζόταν ενιαίες μέθοδοι για τη διαχείριση συσκευών που αγοράστηκαν από διαφορετικούς παροχείς Το 1987 άρχισε εργασία στο SNMP και ο ορισμός του SNMP v1 τελείωσε το 1988 Το SNMP γρήγορα έγινε η πρότυπη μέθοδος για την απόκτηση πληροφορίας σχετικά με την κατάσταση και τη λειτουργία των δικτυακών στοιχείων

Επιπλέον η ανάγκη να κατανοηθεί η ευρείας κλίμακος συμπεριφορά του δικτύου γινόταν ένα θέμα Όταν δύο κεντρικοί υπολογιστές ήταν ανίκανοι να επικοινωνήσουν ήταν συχνά δύσκολο να καθοριστεί η τοποθεσία του προβλήματος Το 1988 γράφτηκε η πρώτη έκδοση του traceroute Όπως περιγράφηκε στο Κεφάλαιο 5 το traceroute χρησιμοποιεί μηνύματα TIME EXCEEDED του ICMP για να ανακαλύψει διεπαφές σε κάθε δρομολογητή κατά μήκος μιας διαδρομής Το πρωτόκολλο ICMP δε σχεδιάστηκε ρητά για να υποστηρίξει ανακάλυψη τοπολογίας Όμως η ανάγκη για αποσφαλμάτωση προβλημάτων συνδεσμικότητας είχε γίνει τόσο μεγάλη που το traceroute υιοθετήθηκε σύντομα ευρέως

Έτσι οι τάσεις της αύξησης της δικτυακής κλίμακας συνδυασμένες με την εμφάνιση μιας εμπορικής αγοράς για δικτυακό εξοπλισμό προώθησε ένα νέο είδος δικτυακής μέτρησης λειτουργικά οδηγούμενες μετρήσεις σχεδιασμένες να εξυπηρετήσουν τη διαχείριση και τη διάγνωση σφαλμάτων

Μέτρηση Κυκλοφορίας Υψηλής ταχύτητας Μέχρι τις αρχές του 1990 οι στατιστικές ιδιότητες της δικτυακής κυκλοφορίας εμφανίζονταν σαν ένα σημαντικό ζήτημα Νέες δικτυακές τεχνολογίες όπως δρομολογητές υψηλής ταχύτητας και μεταγωγείς Ασύγχρονης Κατάστασης Μεταφοράς (Asynchronous Transfer Mode - ATM) αναπτύσσονταν Οι στατιστικές ιδιότητες της δικτυακής κυκλοφορίας έχουν ισχυρή επίδραση στη σχεδίαση τη ρύθμιση και τον υπολογισμό απόδοσης αυτού του είδους εξοπλισμού Συγκεκριμένα οι μεταγωγείς ATM αναπτύσσονταν με το σκοπό της υποστήριξης επικοινωνίας δεδομένων και φωνής Οι στατιστικές ιδιότητες κυκλοφορίας φωνής κατανοήθηκαν καλά σαν αποτέλεσμα δεκαετιών μέτρησης Όμως ενώ οι βασικές ιδιότητες κυκλοφορίας δικτυακών δεδομένων

411

συχνά θεωρήθηκαν παρόμοιες σε κυκλοφορία φωνής στην πραγματικότητα ήταν πολύ λιγότερο κατανοητές

Σαν αποτέλεσμα συστήματα για υψηλής ταχύτητας σύλληψη πακέτων αναπτύχθηκαν και παρατάχθηκαν σε δικτυακά εργαστήρια Η επόμενη στατιστική ανάλυση αυτών των μαζικών συνόλων δεδομένων παρείχε τη βάση για την ανάπτυξη αυτομοίων μοντέλων κυκλοφορίας όπως περιγράφτηκε στο Κεφάλαιο 6 Τα αυτόμοια μοντέλα είναι πολύ διαφορετικά από τα μοντέλα που χρησιμοποιούνται για να περιγράψουν κυκλοφορία φωνής και η ευρεία χρήση τους αναπαριστά μια θεμελιώδη αλλαγή στον τρόπο που χαρακτηρίζεται η Διαδικτυακή κυκλοφορία

Αυτή η εξέλιξη αναπαριστά την έναρξη της λεπτομερούς ανάλυσης πολύ μεγάλων σύνολων δεδομένων σε σχέση με τη Διαδικτυακή μέτρηση Σε όλο το βιβλίο είδαμε ότι τα προβλήματα που σχετίζονταν με τη σύλληψη και ανάλυση μαζικών όγκων δεδομένων είναι τώρα μια καθημερινή μέριμνα στη Διαδικτυακή μέτρηση

Η μέτρηση και ανάλυση κυκλοφορίας υψηλής ταχύτητας επίσης αντιπροσώπευσαν τις απαρχές μιας άλλης διεισδυτικής τάσης στη Διαδικτυακή μέτρηση τη μεταχείριση του Διαδικτύου σαν αντικείμενο επιστημονικής μελέτης Η ανάπτυξη αυτομοίων μοντέλων κυκλοφορίας μεταχειρίστηκε τη δικτυακή κυκλοφορία σαν ένα άγνωστο αντικείμενο που χρειαζόταν να χαρακτηριστεί και να κατανοηθεί και οι ασυνήθεις πλευρές αυτομοιότητας πυροδότησαν ένα μεγάλο ποσό επακόλουθης μέτρησης και ανάλυσης Έτσι η ανάλυση της κυκλοφορίας υψηλής ταχύτητας διεύρυνε την εστίαση στη δικτυακή μέτρηση για να περιλάβει ερευνητικά ερωτήματα μια εστίαση που ήταν κατά μέγα μέρος απούσα από τα μέσα του 1970

Μέτρησεις Ιστού και Εφαρμογής Η έκρηξη του Παγκοσμίου Ιστού που ξεκίνησε γύρω στο 1994 ξεσήκωσε σημαντικό ενδιαφέρον στις περιοχές των φορτίων εργασίας Ιστού Από τότε που ο Ιστός γρήγορα έγινε η κυρίαρχη εφαρμογή στο Διαδίκτυο με όρους ποσότητας κυκλοφορίας οι ιδιότητες των φορτίων εργασίας Ιστού ήταν σημαντικές για την κατανόηση των αποτελεσμάτων τους στη Διαδικτυακή κυκλοφορία Επιπλέον οι μετρήσεις Ιστού χρειάζονταν να υπολογίσουν θέματα απόδοσης και να υπολογίσουν προτεινόμενες αλλαγές σχεδίου σε εξυπηρέτες Ιστού και πρωτόκολλα

Ὀπως συζητήθηκε στο Κεφάλαιο 7 οι προσπάθειες μέτρησης Ιστού ακολούθησαν ένα αριθμό διαφορετικών ωθήσεων Μια ποικιλία βελτιώσεων στο πρωτόκολλο HTTP προτάθηκαν και μετρήσεις χρειάστηκαν για να υπολογιστούν τα έξοδα και τα οφέλη αυτών των προτάσεων Η ανάπτυξη χρήσης κρυφής μνήμης Ιστού ξεσήκωσε μελέτες μετρήσεων για τον προσδιορισμό καλών αλγορίθμων αντικατάστασης κρυφής μνήμης στρατηγικών τοποθέτησης κρυφής μνήμης και σχεδιασμού χωρητικότητας κρυφής μνήμης Τελικά ο Ιστός γρήγορα έγινε η βάση για ηλεκτρονικό εμπόριο και έτσι πολλές εταιρίες είχαν ένα οικονομικό ενδιαφέρον στη μέτρηση και επαλήθευση της απόδοσης των συνδυαλλαγών Ιστού και στη διαβεβαίωση ότι κρίσιμοι εξυπηρετητές Ιστού παρέμεναν συνδεδεμένοι χειρίζονταν αιτήσεις γρήγορα και εφοδιάζονταν να χειριστούν υπερτάσεις

Η εργασία στη μέτρηση Ιστού ξεσκέπασε ένα αριθμό ενδιαφερόντων φαινομένων Αυτά περιλαμβάνουν υψηλή μεταβλητότητα σε μεγέθη αντικειμένων Ιστού την εφαρμοσιμότητα του νόμου του Zipf σε σχέση με τις αιτήσεις σε σελίδες Ιστού και τοποθεσίες Ιστού φαινόμενα αστραπιαίου συνωστισμού και τις ιδιότητες διασύνδεσης σελίδων Ιστού που επηρεάζουν την απόδοση των μηχανών αναζήτησης

Ο Ιστός ήταν το πρώτο παράδειγμα μιας εφαρμογής laquoφονιάraquo που ξεσήκωσε και παρακίνησε σημαντική δραστηριότητα μέτρησης από τη μεγάλη του δημοτικότητα Αυτό το πρότυπο έχει στη συνέχεια επαναληφθεί πχ με ομότιμες (peer-to-peer) εφαρμογές και δικτυωμένα παιχνίδια

511

Δικτυακά προσανατολισμένη Μέτρηση Κυκλοφορίας Όπως ήδη αναφέρθηκε η εργασία στη μέτρηση κυκλοφορίας τη δεκαετία του 1990 επικεντρώθηκε κυρίως σε ερωτήματα σχετικά με τον υπολογισμό της απόδοσης Αυτές οι προσπάθειες επικεντρώθηκαν σε μετρήσεις μικρής χρονικής κλίμακας (χιλιοστά του δευτερολέπτου μέχρι ώρες) και επίσης έτειναν να επικεντρωθούν σε μετρήσεις που λήφθηκαν σε ένα μόνο σημείο στο δίκτυο

Ξεκινώντας γύρω στο 2000 η προσοχή της έρευνας στη μέτρηση κυκλοφορίας διευρύνθηκε ώστε να περιλάβει ερωτήματα σχετιζόμενα πιο άμεσα με δικτυακές λειτουργίες και διαχείριση Όπως συζητήθηκε στο Κεφάλαιο 6 αυτά τα ερωτήματα αφορούσαν την κυκλοφορία σε μεγαλύτερες χρονικές κλίμακες (ώρες μέχρι μήνες) και συχνά περιλάμβανε μετρήσεις που έγιναν σε διάφορα σημεία εντός του δικτύου

Ερωτήματα δικτυακά προσανατολισμένης μέτρησης έτειναν να επικεντρωθούν σε θέματα όπως η κατανόηση ενός πίνακα δικτυακής κυκλοφορίας στο χαρακτηρισμό των ημερησίων και εβδομαδιαίων προτύπων κυκλοφοριακής παραλλαγής και στη μελέτη και πρόβλεψη του τρόπου με τον οποίο η κυκλοφορία ενός δικτύου αυξάνεται με το χρόνο Μια σχετική προσπάθεια που άρχισε περίπου τον ίδιο χρόνο επιδίωξε να αντιληφθεί τη συμπεριφορά του γενικού συστήματος δρομολόγησης όπως ελέγχεται μέσω του BGP Οι γενικές ιδιότητες της κυκλοφορίας BGP και οι ειδικοί τρόποι με τους οποίους τα γεγονότα BGP επηρεάζουν χωριστά δίκτυα άρχισαν να μελετώνται στενά

Η προσπάθεια που δαπανήθηκε σε αυτές τις κατευθύνσεις μέτρησης φαίνεται να έχει προέλθει σε μεγάλο μέρος από δικτυακούς χειριστές που αναζήτησαν μια πιο παραδεκτή βάση για δικτυακές λειτουργίες και διαχείριση Μεγάλοι εμπορικοί πάροχοι υπηρεσιών Διαδικτύου είχαν σε πολλές περιπτώσεις βασιστεί σε εξειδικευμένες προσεγγίσεις για λειτουργίες και σχεδιασμό με κάθε πάροχο να αναπτύσσει τις δικές του προσεγγίσεις μέτρησης Αυτοί οι χειριστές ήταν σε λειτουργία για ένα αριθμό ετών (συνήθως από τα τέλη της δεκαετίας του 1980 ή τις αρχές της δεκαετίας του 1990) και κάποιοι άρχισαν να αναζητούν καλύτερα εργαλεία για διαχείριση δικτύων Έτσι η τάση προς δικτυακά προσανατολισμένη μέτρηση κυκλοφορίας που προέκυψε αυτόν τον καιρό ήταν ένα φυσικό αποτέλεσμα των αναγκών δικτυακών χειριστών

Στατιστικός Συμπερασμός Καθώς το ενδιαφέρον στη Διαδικτυακή μέτρηση μεγάλωσε τα τέλη της δεκαετίας του 1990 και τις αρχές της δεκαετίας του 2000 έγινε φανερό ότι πολλά είδη χρήσιμης πληροφορίας ἠταν δύσκολο ή αδύνατο να αποκτηθούν Σε όλο το βιβλίο περιγράψαμε τους διαφόρους τρόπους με τους οποίους πληροφορία για το δίκτυο κρύπτεται από διαχειριστικά όρια επίπεδα πρωτοκόλλων και έλλειψη δυνατοτήτων μέτρησης

Αυτή η κατάσταση σχέσεων παρακίνησε το ενδιαφέρον στο στατιστικό συμπερασμό σαν ένα εργαλείο για υπολογισμό ή αντικατάσταση χαμένων ή μη διαθέσιμων δεδομένων μέτρησης Έρευνα που εφάρμοζε το συμπερασμό σε προβλήματα δικτύωσης άρχισε περί το 1996 με μεθόδους για υπολογισμό πινάκων κυκλοφορίας [Var96] και ακολουθήθηκε το 1999 από εργασία στον υπολογισμό ιδιοτήτων εσωτερικού δικτύου από μετρήσεις από άκρη σε άκρη [CDHT99] Αυτά τα αποτελέσματα παρακίνησαν ένα μεγάλο αριθμό ακόλουθης διερεύνησης και σε νέες στατιστικές μεθόδους και στην εφαρμογή μεθόδων στατιστικού συμπερασμού σε μια ευρεία ποικιλία προβλημάτων μέτρησης

Όπως περιγράφηκε στα κεφάλαια 5 και 6 η χρήση στατιστικού συμπερασμού στη Διαδικτυακή μέτρηση είναι τώρα ευρέως διαδεδομένη Αυτό μπορεί να θεωρηθεί σαν μια φυσική αντίδραση στην έλλειψη παρατηρησιμότητας που υπάρχει σε πολλές πλευρές της Διαδικτυακής αρχιτεκτονικής

Διεπιστημονικοί Σύνδεσμοι Η αύξηση του ενδιαφέροντος σε στατιστικές μεθόδους για την ανάλυση Διαδικτυακών μετρήσεων διεύρυνε την κοινότητα των ερευνητών Διαδικτυακής μέτρησης για να περιλάβει πολλούς στατιστικούς και μαθηματικούς Αρχίζοντας γύρω στο

611

2000 η κοινότητα επεκτάθηκε περισσότερο για να περιλάβει φυσικούς εργαζομένους στη στατιστική φυσική (ονομαζομένη επίσης στατιστική μηχανική)

Η στατιστική φυσική ασχολείται με τις μεγάλης κλίμακας στατιστικές ιδιότητες συλλογών πολλών αλληλεπιδρώντων συστατικών Καθώς το Διαδίκτυο έχει αυξηθεί οι Διαδικτυακές μετρήσεις έχουν γίνει πιο επιδεκτικές στα εργαλεία της στατιστικής φυσικής Πολύ από την εστίαση αυτής της εργασίας ήταν στη μελέτη και κατανόηση των ιδιοτήτων μεγάλων γράφων που προέκυψαν από Διαδικτυακές μετρήσεις (πχ ο γράφος δρομολογητών και ο γράφος AS) Το γενικό πεδίο επίσης αναφέρεται ως σύνθετα δίκτυα στη βιβλιογραφία της φυσικής και περιλαμβάνει μελέτη μεγάλων γράφων που προκύπτουν σε άλλα πεδία όπως η βιολογία και η μηχανική

Η τάση προς προσεγγίσεις στατιστικής φυσικής έχει κατευθυνθεί από μια επιθυμία για κατανόηση των γενικών ή μακροσκοπικών ιδιοτήτων του Διαδικτύου σαν συνάρτηση τοπικών ιδιοτήτων όπως επαγγελματικές αποφάσεις που λαμβάνονται από χωριστούς διαχειριστές δικτύου Αυτή η γραμμή έρευνας δεν έχει ακόμη πλήρως επιτύχει αυτό το σκοπό αλλά έχει παρακινήσει ένα ευρύ φάσμα ερωτημάτων και σημαντική τρέχουσα μελέτη Μια πρόσφατη θεώρηση των Διαδικτυακών μετρήσεων από μια οπτική στατιστικής φυσικής δίνεται στο [PSV04]

112 Δυσκολίες

Οι ευρείες τάσεις στη Διαδικτυακή μέτρηση που μόλις περιγράφηκαν έχουν κατευθυνθεί από μια ποικιλία παραγόντων Αυτές οι τάσεις προέρχονται από μια αλληλεπίδραση σκοπών μέτρησης και δυσκολιών μέτρησης

Σε αυτήν την ενότητα επιθεωρούμε τις κύριες δυσκολίες στη Διαδικτυακή μέτρηση και το πώς επηρεάζουν τάσεις στη Διαδικτυακή μέτρηση Καθένα από αυτά τα αντικέιμενα έχει απαντηθεί πολλές φορές στο βιβλίο σε ποικίλες μορφές αυτή η ενότητα εξυπηρετεί να τις συλλέξει και να τις επιθεωρήσει όλες σε ένα μέρος

Θέματα Διαδικτυακής μέτρησης μπορούν ευρέως να διαχωριστούν σε τέσσερις κατηγορίες πρακτικά θέματα στατιστικές δυσκολίες αρχιτεκτονικά θέματα και διαχειριστικά θέματα

Πρακτικά Θέματα Υπάρχει ένα ευρύ φάσμα πρακτικών προβλημάτων που εξασθενούν τη δυνατότητά μας να μετρήσουμε το Διαδίκτυο

Πρώτα ο καθαρός όγκος των δεδομένων είναι μια σημαντική πρόκληση Θέματα όγκου δεδομένων προκύπτουν σε μετρήσεις κυκλοφορίας σε μετρήσεις εφαρμογής και σε μετρήσεις υποδομής Τα μαζικά σύνολα δεδομένων που μπορούν να συλλεγούν παρουσιάζουν μια πρόκληση για αποθήκευση και επεξεργασία Σε περιπτώσεις όπως μέτρηση τοπολογίας η διαδικασία της συλλογής δεδομένων απαιτεί ένα σημαντικό ποσό χρόνου

Ένας επιδεινωτικός παράγοντας είναι ο ρυθμός αλλαγής των αντικειμένων ή ιδιοτήτων που μετρώνται Το σύστημα μπορεί να αλλάξει κατά τη διάρκεια της χρονικής περιόδου που λαμβάνονται μετρήσεις Για παράδειγμα στη μέτρηση τοπολογίας κεντρικοί υπολογιστές και σύνδεσμοι μπορούν να συνδεθούν και αποσυνδεθούν ενόσω λαμβάνει χώρα η μέτρηση Στη μέτρηση Ιστού το περιεχόμενο μπορεί να αλλάξει κατά τη διάρκεια της πορείας ενός γύρου (crawl) Στη μέτρηση P2P οι ομότιμοι μπορούν να συνδεθούν και να εξαφανιστούν κατά τη διάρκεια της μέτρησης Κατά τη διάρκεια μεγαλυτέρων περιόδων μέτρησης οι μέσοι όροι επιπέδων κυκλοφορίας θα τείνουν να αυξάνουν με το χρόνο και το μίγμα των πρωτοκόλλων και εφαρμογών που χρησιμοποιούνται στο δίκτυο θα μετατοπισθεί (όπως έχει συμβεί σε σχέση με εφαρμογές Ιστού και P2P)

711

Αυτή η σταθερή αλλαγή καθιστά δύσκολη την αναγνώριση laquoαντιπροσωπευτικώνraquo συνθηκών σε πολλές καταστάσεις Ένα συγκεκριμένο μίγμα εφαρμογής ή πρότυπο κυκλοφορίας μπορεί μόνο να είναι αντιπροσωπευτικό ορισμένων ειδών δικτύων ή σε ορισμένους χρόνους Ένα συγκεκριμένο μίγμα τύπων χρηστών ή πελατών θα έτεινε να αλλάζει με το χρόνο καθώς νέοι πελάτες συνδέονται ολόγυρα του κόσμου με διαφορετικούς βαθμούς συνδεσμικότητας

Αυτά τα πρακτικά θέματα παρουσιάζουν προκλήσεις που έχουν αντιμετωπισθεί με μια ποικιλία τρόπων Μετρήσεις εκτελούνται αυξανόμενα χρησιμοποιώντας δειγματοληψία για την ελάττωση του όγκου δεδομένων που συλλέγεται Αυτό είχε οδηγήσει σε ενδιαφέρον προς και ανάπτυξη από μεθόδους για συμπερασμό ιδιοτήτων πρωτοτύπων δεδομένων από δειγματοληπτημένες μετρήσεις Όταν δεν μπορούν να δειγματοληφθούν δεδομένα συστήματα για συλλογή αποθήκευση και διαχείριση μεγάλων συνόλων δεδομένων μπορούν να εφαρμοστούν που κάνουν το πρόβλημα λιγότερο οξύ

Στατιστικά Θέματα Σε όλο το βιβλίο έχουμε δεί ότι η εργασία με Διαδικτυακά δεδομένα περιλαμβάνει ασυνήθεις στατιστικές δυσκολίες

Το πιο εξέχον στατιστικό θέμα στη Διαδικτυακή μέτρηση είναι το φαινόμενο της υψηλής μεταβλητότητας Υψηλή μεταβλητότητα εμφανίζεται στην κυκλοφορία (μήκη ροής και σύνδεσης) στην υποδομή (βαθμός κόμβων στους γράφους δρομολογητών και AS) και στις εφαρμογές (μεγέθη αντικειμένων Ιστού) Οι στατιστικές δυσκολίες της εργασίας με πολύ μεταβλητά δεδομένα έχουν αποκαλυφθεί σε προηγούμενα κεφάλαια περιλαμβάνουν την αστάθεια των παραδοσιακών μετρικών όπως ο εμπειρικός μέσος και η διασπορά την ανάγκη για επικέντρωση σε ουρές κατανομών για σκοπούς χαρακτηρισμού και την μετατόπιση της εστίασης σε ασυνήθη (μακρυών ουρών) πιθανοτικά μοντέλα

Ένα επιπλέον θέμα είναι η σταθερότητα Μετρημένες συνθήκες υπόκεινται σε απροσδόκητη αλλαγή κάθε στιγμή βλάβες εξοπλισμού αστραπιαίοι συνωστισμοί και δικτυακή συντήρηση όλα έχουν το δυναμικό να επηρεάσουν δραστικά τις μετρήσεις σε μια σύντομο περίοδο Αυτό κάνει τη μοντελοποίηση πιο δύσκολη στάσιμα μοντέλα μπορεί να είναι ακατάλληλα όταν μεγάλες αλλαγές στις δικτυακές συνθήκες λαμβάνουν χώρα

Έχουμε δει ότι κάποια μέτρα Διαδικτυακών ιδιοτήτων επιδεικνύουν ισχυρή μνήμη Κυρίως η κυκλοφορία δικτύου δείχνει εξάρτηση μεγάλου βεληνεκούς Αυτό κάνει τη μοντελοποίηση προκλητική απαιτώντας τη χρήση πιο εξεζητημένων μοντέλων στην περιγραφή δικτυακής κυκλοφορίας Η προσομοίωση και ο υπολογισμός απόδοσης είναι επίσης πιο δύσκολα σαν αποτέλεσμα της ισχυρής μνήμης στη δικτυακή κυκλοφορία

Αρχιτεκτονικά Θέματα Ένας αριθμός δυσκολιών στη Διαδικτυακή μέτρηση προέρχονται από ιδιότητες της αρχιτεκτονικής του Διαδικτύου

Η απλότητα πυρήνα αναφέρεται στην ιδέα ότι ενδοδικτυακά στοιχεία (δρομολογητές και μεταγωγείς) πρέπει να είναι σχετικά απλές συσκευές Έχουμε δει ότι ένας τρόπος που τέτοιες συσκευές μπορεί να απλοποιηθούν είναι να παραλειφθούν εξεζητημένες δυνατότητες μέτρησης Έτσι είναι γενικά δύσκολο να αποκτηθεί πληροφορία από δικτυακά στοιχεία σχετικά με μήκη ουρών σε δρομολογητές ή απώλεια και καθυστέρηση χωριστών πακέτων

Μια άλλη διάσταση της απλότητας πυρήνα είναι ότι επίπεδα πρωτοκόλλων πάνω από το IP συχνά δεν ιχνηλατούνται στους δρομολογητές και μεταγωγείς Έτσι για παράδειγμα μπορεί να είναι δύσκολο να παρακολουθηθεί η κυκλοφορία στο επίπεδο ροής ή σε άλλα επίπεδα υψηλότερα από αυτά των πακέτων

Η κλεψύδρα IP επίσης δημιουργεί προβλήματα κρύπτοντας πληροφορία σχετικά με επίπεδα κάτω από το IP Πακέτα μπορούν να περάσουν πάνω από ένα φάσμα διαφορετικών φυσικών μέσων με ιδιότητες που ποικίλουν ευρέως ndash για παράδειγμα ασύρματα LAN οπτική ίνα καλώδιο χαλκού και σύνδεσμοι δορυφόρου Κάποια από αυτά τα μέσα μπορεί να

811

εφαρμόζουν επαναμετάδοση ή διόρθωση εμπροσθίου σφάλματος αποκρύπτοντας τη φθορά πακέτου στο φυσικό επίπεδο Η μέτρηση στο επίπεδο πακέτου (IP) γενικά δεν περιλαμβάνει πληροφορίες σχετικά με λεπτομέρειες όπως αυτές σε χαμηλότερα επίπεδα

Τελικά το γεγονός ότι το Διαδίκτυο έχει μια αποκεντρωμένη οργάνωση σε πολλά επίπεδα σημαίνει ότι δεν υπάρχει πραγματικά κεντρική τοποθεσία στο δίκτυο για σκοπούς παρακολούθησης Για παράδειγμα υπάρχουν πολλά αυτόνομα συστήματα ανωτάτου επιπέδου στο Διαδίκτυο και ένα πακέτο μπορεί να ρεύσει μέσω οποιουδήποτε (ή κανενός) από αυτά Επιπλέον τα αυτόνομα συστήματα ανωτάτου επιπέδου γενικά συνδέονται μεταξύ τους σε πολλαπλές τοποθεσίες Αυτή η πλεγματοειδής δομή σημαίνει ότι μετρήσεις που γίνονται σε κάθε μονό σημείο αναπόφευκτα χάνουν ένα μεγάλο κλάσμα κυκλοφορίας δικτύου

Διαχειριστικά θέματα Όπως είδαμε το Διαδίκτυο είναι ένα δίκτυο δικτύων τα συστατικά δίκτυα κατέχονται και λειτουργούνται από ανεξάρτητες οντότητες ndash τους Παρόχους Υπηρεσιών Δικτύου (ISP) Πολλοί ISP είναι κερδοσκοπικές οντότητες σε ανταγωνισμό μεταξύ τους

Σαν αποτέλεσμα οι ISP αντιστέκονται στη διάθεση σημαντικής πληροφορίας εκτός του οργανισμού τους επειδή αυτή η πληροφορία μπορεί να χρησιμοποιηθεί από τον ανταγωνιστή τους Για παράδειγμα οι ISP γενικά δε δημοσιεύουν πόση κυκλοφορία μεταφέρουν τα δίκτυά τους ή το μέγεθος ή την ακριβή φυσική διάταξη των δικτύων τους ή τη σύνθεση της κυκλοφορίας τους (όπως το μίγμα εφαρμογής ή η διάδοση κακόβουλης κυκλοφορίας)

Η έλλειψη εξωτερικής πληροφορίας σχετικά με ξεχωριστά λειτουργούμενα δίκτυα εμποδίζει πολλούς αξιέπαινους σκοπούς Για παράδειγμα αυτή η μυστικότητα εξασθενεί την ικανότητά μας να ανιχνεύσουμε ξεσπάσματα λογισμικού σκουληκιού (worm) ανά το δίκτυο ή να κατανοήσουμε το ρυθμό αύξησης της δικτυακής κυκλοφορίας παγκοσμίως

113 Μελλοντική Εργασία

Οι δυσκολίες που συγκαταριθμήθηκαν στην τελευταία ενότητα παρέχουν ένα πλαίσιο για την κατανόηση του πώς η μελλοντική Διαδικτυακή μέτρηση θα περιοριστεί και προκληθεί Σε αυτήν την ενότητα ρίχνουμε μια ματιά στις τάσεις μέτρησης που μπορούν να προβλεφθούν στο μέλλον

1131 Ερευνητικές Προκλήσεις Η προσπάθεια να αυξηθεί η Διαδικτυακή κατανόησή μας οδηγεί σε έναν αριθμό

ερευνητικών προκλήσεων Αυτές αντιπροσωπεύουν ερωτήματα σχετικά με το πώς η Διαδικτυακή μέτρηση θα έπρεπε να διεξαχθεί στο μέλλον

Πλατφόρμες Μέτρησης Σε προηγούμενες ενότητες έχουμε δει ότι υπάρχουν πολλές ανικανοποίητες προκλήσεις στη μέτρηση του Διαδικτύου από την άλλη πλευρά η δραστηριότητα στη Διαδικτυακή μέτρηση έχει αυξηθεί δραματικά στα τελευταία χρόνια Αυτά τα δύο γεγονότα δείχνουν ότι φαίνεται αξιόλογο να ανατεθεί αυξημένη προσπάθεια στην κατασκευή πλατφορμών και υποδομής για Διαδικτυακή μέτρηση

Τα έργα που συζητήθηκαν στο Κεφάλαιο 10 δείχνουν ότι ένα φάσμα αρχιτεκτονικών επιλογών είναι δυνατό στην κατασκευή πλατφορμών μέτρησης [EMG] Αυτές οι επιλογές επηρεάζουν τη χρησιμότητα και την μακροπρόθεσμη επιτυχία των προσπαθειών μέτρησης που χρησιμοποιούν αυτές οι πλατφόρμες Κάποιες από τις θεωρήσεις είναι

bull Ποιος θα έπρεπε να χρηματοδοτήσει την υποδομή μέτρησης για το Διαδίκτυο Και κυβερνητικές και εμπορικές προσεγγίσεις είναι δυνατές

bull Θα έπρεπε μια υποδομή μέτρησης να ελεγχθεί από ένα μόνο οργανισμό ή θα έπρεπε ο έλεγχός του να μοιράζεται από πολλαπλούς διερευνητές ή ομάδες

911

bull Πώς θα έπρεπε να χρησιμοποιηθούν τα συστήματα μέτρησης Πώς θα έπρεπε να ληφθούν αποφάσεις αναφορικά με τη σχετική έμφαση σε διαφορετικούς σκοπούς για μια πλατφόρμα μέτρησης

bull Θα έπρεπε να κατασκευαστούν εξειδικευμένες πλατφόρμες μέτρησης ίσως για συγκεκριμένες κοινότητες χρηστών ή για την απάντηση συγκεκριμένων ζητημάτων Αν μια πλατφόρμα πρέπει να είναι γενικής χρήσης τι μορφή θα έπρεπε να πάρει

Η κατασκευή πλατφορμών μέτρησης ευρείας κλίμακας έχει το δυναμικό να κάνει πρόοδο σε θεμελιώδη ανοιχτά ερωτήματα αναφορικά με το Διαδίκτυο Για παράδειγμα η παγκόσμια τοπολογία του Διαδικτύου είναι ανεπαρκώς γνωστή και θα μπορούσε να ερευνηθεί πληρέστερα η φύση και διάδοση κακόβουλης δραστηριότητας στο Διαδίκτυο θα μπορούσε να εκτιμηθεί ακριβέστερα και ο βαθμός στον οποίο η κυκλοφορία αυξάνει και αλλάζει στο Διαδίκτυο θα μπορούσε να κατανοηθεί καλύτερα

Αποτελέσματα Διαμοιραζόμενης Μέτρησης Επίσης σημειώνουμε ότι ένω η απόκτηση Διαδικτυακών μετρήσεων μπορεί να απαιτεί σημαντική προσπάθεια σε πολλές περιπτώσεις μετρήσεις χρησιμοποιούνται μόνο για μια μόνη μελέτη η μόνο από τον οργανισμό που κάνει τις μετρήσεις

Αυτό δείχνει ότι περισσότερη εργασία θα έπρεπε να γίνει για να ξεπεραστούν οι φραγμοί στο συχνό διαμοιρασμό των μετρήσεων ή σχετιζομένων δεδομένων Αυτοί οι φραγμοί περιλαμβάνουν

bull Οι οργανισμοί μπορεί να έχουν μονοπωλιακό ενδιαφέρον σε κάποια είδη δεδομένων που ελέγχουν αλλά όχι σε άλλα Υπάρχει μια ανάγκη για μεθόδους για να γίνουν διαθέσιμες οι μετρήσεις με τρόπους που δεν απελευθερώνουν εμπορικά ευαίσθητη πληροφορία

bull Είναι συχνά μάλλον δύσκολο να τεθούν σύνολα δεδομένων μέτρησης σε μια μορφή που άλλα μπορούν να χρησιμοποιήσουν Είναι σημαντικό να κατανοηθεί και τεκμηριωθεί το πώς έγιναν οι μετρήσεις η ποιότητα των δεδομένων (συμπεριλαμβανομένης της σημείωσης του ποιά σημεία δεδομένων είναι εσφαλμένα) η μορφή των δεδομένων και οι υποθέσεις που υπόκεινται της συλλογής δεδομένων Αυτή η προσπάθεια παίρνει χρόνο

bull Η αποθήκευση και η κατανομή μεγάλων συνόλων δεδομένων μπορεί να απαιτεί σημαντκούς πόρους συμπεριλαμβανομένων του χώρου δίσκου και της χωρητικότητας δικτύου Αυτοί οι πόροι είναι ακριβοί και η χρήση τους πρέπει να δικαιολογηθεί

Η έρευνα σε αυτήν την περιοχή είναι σημαντική επειδή ο διαμοιρασμός μετρήσεων έχει πολλές ωφέλειες Σημαίνει ότι η προσπάθεια στην απόκτηση μετρήσεων ξεπληρώνεται με πολλαπλές χρήσεις Επιτρέπει τα ερευνητικά αποτελέσματα που βασίζονται στην ανάλυση των δεδομένων να επαληθευτούν ανεξάρτητα Και επιτρέπει νέα ερωτήματα να ερωτηθούν ερωτήματα που μπορεί να μην ήταν η βάση για την πρωτότυπη προσπάθεια μέτρησης

1132 Αναδυόμενα Ερωτήματα Ολοκληρώνοντας το βιβλίο είναι φυσικό να ερωτούμε ποια είναι τα επόμενα βήματα στη

Διαδικτυακή μέτρηση Πού πηγαίνει το πεδίο και ποια αναδυόμενα ερωτήματα μπορούν να προβλεφθούν Βεβαίως είναι αδύνατο να απαντηθούν πλήρως αυτές οι ερωτήσεις αλλά σε αυτήν την ενότητα προτείνουμε κάποιες μερικές απαντήσεις Χωρίζουμε τα θέματα σε βραχυπρόθεσμα και πιο μακροπρόθεσμα ερωτήματα μέτρησης

Βραχυπρόθεσμα Αυτό το βιβλίο έχει καλύψει ένα ευρύ φάσμα θεμάτων στη Διαδικτυακή μέτρηση Τα υποπεδία της υποδομής κυκλοφορίας και μέτρησης εφαρμογής είναι το καθένα σύνθετο αυτό καθαυτό Επιπλέον οι σχετιζόμενες περιοχές της ανωνυμοποίησης και ασφάλειας περιέχουν πολλά προσθέτα θέματα Παρόλα αυτά υπάρχουν περισσότερα στη

1011

Διαδικτυακή μέτρηση που μπορούν να προβλεφθούν στο κοντινό μέλλον Πολλά από αυτά τα θέματα αρχίζουν να μελετώνται αλλά δεν είναι ακόμη αναπτυγμένα ή αρκετά ώριμα για να καλυφθούν σε αυτό το βιβλίο

Η περιοχή των μετρήσεων ασυρμάτου Διαδικτύου είναι μια σημαντική αναδυόμενη περιοχή Από τη μία πλευρά η μετάδοση ασυρμάτων δεδομένων έχει χρησιμοποιηθεί στο Διαδίκτυο από τις πρώτες του μέρες ως το ARPANET Όμως στα πρώτα πειράματα του ARPANET ασύρματοι σύνδεσμοι χρησιμοποιήθηκαν για συνδέσεις δικτύου κορμού σε μακρινές τοποθεσίες συνήθως μέσω δορυφόρου Σε αντίθεση η σημασία των ασυρμάτων συνδέσμων έχει αυξηθεί δραματικά πιο πρόσφατα με την εισαγωγή της τεχνολογίας ασυρμάτων LAN Οι πιο αξιοσημείωτοι από αυτούς είναι τα πρωτόκολλα που βασίζονται στο σύνολο προτύπων IEEE 80211 (πχ WiFi)

Η φύση της ασύρματης μέτρησης είναι μάλλον διαφορετική από τη μέτρηση του ενσύρματου Διαδικτύου Η ασύρματη μέτρηση βασίζεται στη σύλληψη μετάδοσης ραδιοκυμάτων Αυτό σημαίνει ότι η ακριβής ασύρματη μέτρηση και η σωστή μετάφραση αυτών των μετρήσεων περιλαμβάνει νέα θέματα και περιορισμούς Σαν αποτέλεσμα το πεδίο της ασύρματης Διαδικτυακής μέτρησης είναι ακόμη σε υπό διαμόρφωσιν στάδια σχετικά λίγες καθοριστικές μελέτες έχουν διεξαχθεί ως τώρα

Μια άλλη αναδυόμενη περιοχή είναι τα δίκτυα αισθητήρα Αυτά είναι δίκτυα συσκευών χαμηλής ισχύος που αναμένεται να σχηματίσουν δίκτυα χωρίς σημαντική υποδομιακή υποστήριξη Υπάρχουν σημαντικά θέματα μέτρησης σχετιζόμενα με αυτά τα δίκτυα Όμως το πεδίο είναι ακόμη νεότερο από αυτό της ασυρμάτου δικτύωσης γενικά και η εργασία δεν είναι ακόμη ώριμη σε αυτήν την περιοχή

Γυρίζοντας στο ενσύρματο Διαδίκτυο ένα θέμα που δεν έχει ακόμη μελετηθεί σε βάθος είναι μετρήσεις δικτύων και κυκλοφορίας IPv6 Ενώ το πρωτόκολλο IPv6 έχει λειτουργήσει για ένα αριθμό ετών η υιοθέτηση του δεν είναι ακόμη ευρέως διαδεδομένη Σε πολλά σημεία η συμπεριφορά του IPv6 διαφέρει από το IPv4 σε μόνο λίγα σημεία αναφορικά με τις μετρήσεις έτσι δεν έχουμε εστιάσει στο IPv6 σε μεγάλο βαθμό στο βιβλίο Όμως καθώς το IPv6 γίνεται πιο ευρέως διαδεδομένο είναι πιθανό ότι νέα θέματα μέτρησης θα προκύψουν

Επιπρόσθετα όπως σημειώθηκε παραπάνω η σουίτα των εφαρμογών που χρησιμοποιούνται στο Διαδίκτυο είναι σε μια συνεχή ρευστότητα Ενώ μπορούμε να αναγνωρίσουμε γενικά μετατοπίσεις στους κυρίαρχους τύπους εφαρμογών πχ από τον Ιστό στο P2P υπάρχουν επίσης σημαντικές δευτερεύουσες μετατοπίσεις Για παράδειγμα εντός του συνόλου εφαρμογής P2P πρώιμες εφαρμογές όπως το KaZaa έχουν παραχωρήσει προτεραιότητα σε πιο πρόσφατες παραλλαγές όπως το BitTorrent Αυτές οι εφαρμογές είναι αρκετά διαφορετικές σε πολλά σημεία και αυτές οι μετατοπίσεις από μια κυρίαρχη εφαρμογή σε μια άλλη έχουν ένα σημαντικό αποτέλεσμα στη φύση της κυκλοφορίας Κοιτάζοντας στο μέλλον δικτυωμένα παιχνίδια έχουν το δυναμικό να γίνουν μια κυρίαρχη εφαρμογή (τουλάχιστον υπό όρους χρηστών αν όχι υπό όρους συνολικής κυκλοφορίας) Έχουμε προσπαθήσει να δώσουμε έμφαση στα μακροχρόνια αποτελέσματα στην περιοχή των Διαδικτυακών εφαρμογών Όμως καθώς νέες εφαρμογές αναδύονται θα υπάρξει μια φυσική μετατόπιση στην εστίαση της προσοχής μέτρησης

Τελικά έχουμε σημειώσει ότι υπάρχει σημαντικό ενδιαφέρον σε στατιστικά μοντέλα φυσικής για ιδιότητες Διαδικτύου Αυτή είναι μια περιοχή έρευνας που συχνά γεφυρώνει επιπλέον θέματα στη βιοπληροφορική κοινωνιολογία και μηχανική Δεν είχαμε το χώρο να καλύψουμε αυτό το ευρύτερο σύνολο θεμάτων Όμως έχουμε δώσει μια επισκόπηση των συνεισφορών της στατιστικής φυσικής μέχρι σήμερα στη Διαδικτυακή μοντελοποίηση και έχουμε δώσει αναφορές σε αυτήν την ερευνητική βιβλιογραφία όπου είναι σχετικό Δραστηριότητα σε αυτήν την περιοχή πιθανό να συνεχίσει και αυξηθεί στο κοντινό μέλλον

1111

Πιο Μακροπρόθεσμα Μια από τις πιο ανοικτού τέλους μελλοντικές κατευθύνσεις αφορά το τι και πώς νέα ερωτήματα θα αναδυθούν στη Διαδικτυακή μέτρηση Έχουμε δει ότι τα είδη των ερωτημάτων που διευθετήθηκαν στη Διαδικτυακή μέτρηση έχουν εξελιχθεί με το χρόνο σε πολλές περιπτώσεις η ανάδυση νέων ερωτημάτων ήταν δύσκολο να προβλεφθεί

Για παράδειγμα η έκρηξη του Παγκοσμίου Ιστού από τις αρχές ως τα μέσα της δεκαετίας του 1990 προκάλεσαν ένα τεράστιο ποσό έρευνας Από τη μια πλευρά αυτή η έρευνα ήταν κυρίως κατευθυνόμενη από τη δημοτικότητα του Ιστού ndash για παράδειγμα ένας αριθμός κατανεμημένων πληροφοριακών συστημάτων προϋπήρξε του Ιστού αλλά αυτά δεν υπόκειντο σε σημαντική προσοχή μέτρησης Από την άλλη πλευρά αυτή η έρευνα επέδειξε έναν αριθμό αποτελεσμάτων που μπορεί να θεωρηθούν θεμελιώδη όπως η παρουσία υψηλής μεταβλητότητας στα μεγέθη και τη δημοτικότητα των αντικειμένων Ιστού

Αυτό το παράδειγμα δείχνει ότι κάποια πιο μακροπρόθεσμα αναδυόμενα ερωτήματα μπορεί να κατευθυνθούν από νέες laquoεφαρμογές φονείςraquo ή από νέους τρόπους χρήσης του Διαδικτύου Αυτά είναι εξ ορισμού δύσκολο να προβλεφθούν

Ένα άλλο σύνολο πιο μακροπρόθεσμων ερωτημάτων αφορά την αυξανόμενη ενσωμάτωση του Διαδικτύου στην κοινωνία Ως τέτοια νέα ερωτήματα μέτρησης θα προκύψουν αναμφισβήτητα σε σχέση με την ανθρώπινη δραστηριότητα Για παράδειγμα καθώς η χρήση του Διαδικτύου έχει αυξηθεί στο εμπόριο υπάρχει αυξανόμενη σπουδαιότητα στην κατανόηση κακόβουλης δραστηριότητας τη μέτρηση γεωγραφικής τοποθεσίας και τη διερεύνηση της σχέσης μεταξύ της οικονομικής ανάπτυξης και της Διαδικτυακής υποδομής Αυτά τα ερωτήματα αρχίζουν να διευθετούνται μέσω εργασίας στην ασφάλεια την ανωνυμοποίηση και άλλα πεδία αλλά υπάρχουν αναμφίβολα πολλά σημαντικά ερωτήματα ακόμη να αναδυθούν

Βιβλιογραφία

Crovella M Krishnamurthy B 2006 Internet Measurement Infrastructure Traffic and Applications John Wiley amp Sons Inc 2006

ΤΕΛΟΣ ΚΑΙ Τῼ ΘΕῼ ΔΟΞΑ

  • 111 Τάσεις στη Διαδικτυακή Μέτρηση
  • 112 Δυσκολίες
  • 113 Μελλοντική Εργασία
    • 1131 Ερευνητικές Προκλήσεις
    • 1132 Αναδυόμενα Ερωτήματα
      • Βιβλιογραφία
Page 2: Μετάφραση τοῦ κεφαλαίου 11 τοῦ βιβλίου «Internet Measurement: Infrastructure, Traffic and Applications» [Translation of chapter 11 of the book «Internet

211

ΕΙΣΑΓΩΓΗ

Ἡ παροῦσα ἐργασία ἀποτελεῖ μία προσπάθεια μετάφρασης τοῦ ἐνδεκάτου κεφαλαίου τοῦ βιβλίου laquoInternet Measurement Infrastructure Traffic and Applicationsraquo1 Γιά ἀρκετούς ὄρους χρησιμοποιήθηκε τό λεξικό ΜΑΤΖΕΝΤΑ2

ΜΕΤΑΦΡΑΣΗ 11 Συμπεράσματα και Προοπτικές

Σε αυτό το κεφάλαιο αποσκοπούμε να συνθέσουμε πολλές πλευρές της Διαδικτυακής μέτρησης για να κατανοήσουμε από πού προήλθε το πεδίο και πού πηγαίνει Για να το κάνουμε πρώτα εξετάζουμε ευρείες τάσεις και επιτεύγματα που μπορούν να παρατηρηθούν σε παρελθοντικές προσπάθειες μέτρησης έπειτα εξετάζουμε τι προκλήσεις είναι σημαντικότερες στο να μετρηθεί το Διαδίκτυο σήμερα και τελικά εξετάζουμε το πώς παρελθοντικές καθώς και τελευταία αναπτυγμένες τάσεις είναι πιθανό να διαμορφώσουν τη Διαδικτυακή μέτρηση στο μέλλον

111 Τάσεις στη Διαδικτυακή Μέτρηση

Είδαμε ότι το Διαδίκτυο έχει μετρηθεί με ποικίλους τρόπους από την έναρξή του ως ARPANET το 1969 Υπήρξε ένας αριθμός τάσεων που επηρέασαν τον τρόπο μέτρησης του Διαδικτύου κατά αυτήν τη χρονική διάρκεια Κάποιες τάσεις είναι τεχνολογικές η Διαδικτυακή τεχνολογία έχει αλλάξει με το χρόνο (πράγμα) το οποίο έχει κάνει κάποιες μετρήσεις να γίνουν δυσκολότερες και κάποιες μετρήσεις ευκολότερες Αλλές τάσεις είναι θέμα κλιμάκωσης η τεράστια αύξηση του Διαδικτύου έχει αλλάξει αυτό που είναι πρακτικά μετρήσιμο και έχει πυροδοτήσει την ανάπτυξη νέων μεθόδων μέτρησης Και κάποιες τάσεις είναι κοινωνικές η μετάβαση τού Διαδικτύου από κυβερνητική επιδότηση σε ιδιωτική λειτουργία και η οικονομική σημασία της Διαδικτυακής επικοινωνἰας έχουν αλλάξει τα είδη των αναγκαίων μετρήσεων και το βαθμό στον οποίο μπορούν να γίνουν ορισμένες μετρήσεις

Η αλληλεπίδραση αυτών των τάσεων με το χρόνο έχει καταλήξει σε κάποια ευρέως αναγνωρίσιμα επιτεύγματα στη φύση και την εστίαση της Διαδικτυακής μέτρησης Στο υπόλοιπο αυτής της ενότητας θα επιθεωρήσουμε κάποια από τα πιο εξέχοντα χαρακτηριστικά του τι η Διαδικτυακή μέτρηση έχει κατορθώσει με το χρόνο

Μετρήσεις ARPANET 1969-1975 Ενώ η κύρια ώθηση πίσω από την αρχική ανάπτυξη του ARPANET ήταν να συνδέσει ερευνητές με απομακρυσμένους υπολογιστές μια σημαντική σχετική ερώτηση ήταν η διερεύνηση της εφικτότητας και χρησιμότητας των αρχών εναλλαγής πακέτων Σαν αποτέλεσμα οι πρώτοι κόμβοι ARPANET (καλούμενοι Επεξεργαστές Διαπροσωπικών Μηνυμάτων (Interface Message Processors - IMPs)) σχεδιάστηκαν και φτιάχτηκαν με εκτεταμένες ενσωματωμένες δυνατότητες αυτομέτρησης όπως περιγράφεται στο [KN74] Αυτά τα χαρακτηριστικά περιέλαβαν την ικανότητα να ιχνηλατήσουν το πέρασμα ενός μόνου πακέτου διαμέσου του δικτύου την ικανότητα να

1 (Crovella M 2006) 2 Αγγλοελληνικό amp Ελληνοαγγλικό λεξικό ΧΡΥΣΗ ΕΚΔΟΣΗ ΜΑΤΖΕΝΤΑ

311

μετρήσουν απευθείας την κυκλοφοριακή ροή μεταξύ δύο οποιονδήποτε κόμβων και την ικανότητα να ρωτήσουν δρομολογητές για τα άμεσα στατιστικά του φορτίου εργασίας τους Ὀπως έχουμε δει στα Κεφάλαια 5 και 6 αυτά τα είδη χαρακτηριστικών είτε λείπουν ή είναι πολύ δύσκολο να χρησιμοποιηθούν στο σημερινό Διαδίκτυο

Τι συνέβη Καθώς το ARPANET αυξήθηκε έχασε τις περισσότερες εγγενείς δυνατότητες μέτρησης Μέχρι το 1975 οι δικτυακές μετρήσεις συντονίστηκαν και συλλέχθηκαν σε ένα μόνο Κέντρο Δικτυακής Μέτρησης (Network Measurement Center - NMC)) στο UCLA Μετά το 1975 ο διαχειριστικός έλεγχος του ARPANET αναλήφθηκε από την Αμυντική Υπηρεσία Επικοινωνιών και οι εκτενής μετρήση του ARPANET έπαυσε Ταυτόχρονα μια νέα γενιά από IMP αναπτύχθηκε και αυτοί ίσως να μην περιείχαν τις ίδιες ενσωματωμένες δυνατότητες μέτρησης που οι αρχικοί IMP κατείχαν

Η εξέλιξη του δικτύου μακρυά από την εκτενή αυτομέτρηση φαίνεται να έχει αναπτυχθεί για πολλούς λόγους Το δίκτυο αυξανόταν σε μέγεθος και η λειτουργία του γινόταν πιο προσανατολισμένη στην παροχή συνδεσιμότητας από ότι στην υποστήριξη έρευνας εναλλαγής πακέτων Από την άλλη πλευρά το δίκτυο δεν ήταν τόσο μεγάλο ώστε να χρειάζεται εκτενής μέτρηση για λειτουργικούς σκοπούς Τελικά η ενσωματωμένη αυτομέτρηση καθιστά συνθετότερη τη σχεδίαση και ακριβότερες τις δικτυακές συσκευές το οποίο ίσως να ήταν ένας παράγοντας επίσης

Λειτουργικές Μετρήσεις Μέχρι τα μέσα του 1980 το δίκτυο μεγάλωνε και πολλοί ανεξάρτητοι οργανισμοί αγόραζαν δικτυακό εξοπλισμό που χρειάζονταν για να λειτουργούν και να διοικούν Γινόταν φανερό ότι χρειαζόταν μία πρότυπη δυνατότητα παρακολούθησης Μία ποικιλία εταιρειών κατασκεύαζε Διαδικτυακό υλικό για εμπορική πώληση και χρειαζόταν ενιαίες μέθοδοι για τη διαχείριση συσκευών που αγοράστηκαν από διαφορετικούς παροχείς Το 1987 άρχισε εργασία στο SNMP και ο ορισμός του SNMP v1 τελείωσε το 1988 Το SNMP γρήγορα έγινε η πρότυπη μέθοδος για την απόκτηση πληροφορίας σχετικά με την κατάσταση και τη λειτουργία των δικτυακών στοιχείων

Επιπλέον η ανάγκη να κατανοηθεί η ευρείας κλίμακος συμπεριφορά του δικτύου γινόταν ένα θέμα Όταν δύο κεντρικοί υπολογιστές ήταν ανίκανοι να επικοινωνήσουν ήταν συχνά δύσκολο να καθοριστεί η τοποθεσία του προβλήματος Το 1988 γράφτηκε η πρώτη έκδοση του traceroute Όπως περιγράφηκε στο Κεφάλαιο 5 το traceroute χρησιμοποιεί μηνύματα TIME EXCEEDED του ICMP για να ανακαλύψει διεπαφές σε κάθε δρομολογητή κατά μήκος μιας διαδρομής Το πρωτόκολλο ICMP δε σχεδιάστηκε ρητά για να υποστηρίξει ανακάλυψη τοπολογίας Όμως η ανάγκη για αποσφαλμάτωση προβλημάτων συνδεσμικότητας είχε γίνει τόσο μεγάλη που το traceroute υιοθετήθηκε σύντομα ευρέως

Έτσι οι τάσεις της αύξησης της δικτυακής κλίμακας συνδυασμένες με την εμφάνιση μιας εμπορικής αγοράς για δικτυακό εξοπλισμό προώθησε ένα νέο είδος δικτυακής μέτρησης λειτουργικά οδηγούμενες μετρήσεις σχεδιασμένες να εξυπηρετήσουν τη διαχείριση και τη διάγνωση σφαλμάτων

Μέτρηση Κυκλοφορίας Υψηλής ταχύτητας Μέχρι τις αρχές του 1990 οι στατιστικές ιδιότητες της δικτυακής κυκλοφορίας εμφανίζονταν σαν ένα σημαντικό ζήτημα Νέες δικτυακές τεχνολογίες όπως δρομολογητές υψηλής ταχύτητας και μεταγωγείς Ασύγχρονης Κατάστασης Μεταφοράς (Asynchronous Transfer Mode - ATM) αναπτύσσονταν Οι στατιστικές ιδιότητες της δικτυακής κυκλοφορίας έχουν ισχυρή επίδραση στη σχεδίαση τη ρύθμιση και τον υπολογισμό απόδοσης αυτού του είδους εξοπλισμού Συγκεκριμένα οι μεταγωγείς ATM αναπτύσσονταν με το σκοπό της υποστήριξης επικοινωνίας δεδομένων και φωνής Οι στατιστικές ιδιότητες κυκλοφορίας φωνής κατανοήθηκαν καλά σαν αποτέλεσμα δεκαετιών μέτρησης Όμως ενώ οι βασικές ιδιότητες κυκλοφορίας δικτυακών δεδομένων

411

συχνά θεωρήθηκαν παρόμοιες σε κυκλοφορία φωνής στην πραγματικότητα ήταν πολύ λιγότερο κατανοητές

Σαν αποτέλεσμα συστήματα για υψηλής ταχύτητας σύλληψη πακέτων αναπτύχθηκαν και παρατάχθηκαν σε δικτυακά εργαστήρια Η επόμενη στατιστική ανάλυση αυτών των μαζικών συνόλων δεδομένων παρείχε τη βάση για την ανάπτυξη αυτομοίων μοντέλων κυκλοφορίας όπως περιγράφτηκε στο Κεφάλαιο 6 Τα αυτόμοια μοντέλα είναι πολύ διαφορετικά από τα μοντέλα που χρησιμοποιούνται για να περιγράψουν κυκλοφορία φωνής και η ευρεία χρήση τους αναπαριστά μια θεμελιώδη αλλαγή στον τρόπο που χαρακτηρίζεται η Διαδικτυακή κυκλοφορία

Αυτή η εξέλιξη αναπαριστά την έναρξη της λεπτομερούς ανάλυσης πολύ μεγάλων σύνολων δεδομένων σε σχέση με τη Διαδικτυακή μέτρηση Σε όλο το βιβλίο είδαμε ότι τα προβλήματα που σχετίζονταν με τη σύλληψη και ανάλυση μαζικών όγκων δεδομένων είναι τώρα μια καθημερινή μέριμνα στη Διαδικτυακή μέτρηση

Η μέτρηση και ανάλυση κυκλοφορίας υψηλής ταχύτητας επίσης αντιπροσώπευσαν τις απαρχές μιας άλλης διεισδυτικής τάσης στη Διαδικτυακή μέτρηση τη μεταχείριση του Διαδικτύου σαν αντικείμενο επιστημονικής μελέτης Η ανάπτυξη αυτομοίων μοντέλων κυκλοφορίας μεταχειρίστηκε τη δικτυακή κυκλοφορία σαν ένα άγνωστο αντικείμενο που χρειαζόταν να χαρακτηριστεί και να κατανοηθεί και οι ασυνήθεις πλευρές αυτομοιότητας πυροδότησαν ένα μεγάλο ποσό επακόλουθης μέτρησης και ανάλυσης Έτσι η ανάλυση της κυκλοφορίας υψηλής ταχύτητας διεύρυνε την εστίαση στη δικτυακή μέτρηση για να περιλάβει ερευνητικά ερωτήματα μια εστίαση που ήταν κατά μέγα μέρος απούσα από τα μέσα του 1970

Μέτρησεις Ιστού και Εφαρμογής Η έκρηξη του Παγκοσμίου Ιστού που ξεκίνησε γύρω στο 1994 ξεσήκωσε σημαντικό ενδιαφέρον στις περιοχές των φορτίων εργασίας Ιστού Από τότε που ο Ιστός γρήγορα έγινε η κυρίαρχη εφαρμογή στο Διαδίκτυο με όρους ποσότητας κυκλοφορίας οι ιδιότητες των φορτίων εργασίας Ιστού ήταν σημαντικές για την κατανόηση των αποτελεσμάτων τους στη Διαδικτυακή κυκλοφορία Επιπλέον οι μετρήσεις Ιστού χρειάζονταν να υπολογίσουν θέματα απόδοσης και να υπολογίσουν προτεινόμενες αλλαγές σχεδίου σε εξυπηρέτες Ιστού και πρωτόκολλα

Ὀπως συζητήθηκε στο Κεφάλαιο 7 οι προσπάθειες μέτρησης Ιστού ακολούθησαν ένα αριθμό διαφορετικών ωθήσεων Μια ποικιλία βελτιώσεων στο πρωτόκολλο HTTP προτάθηκαν και μετρήσεις χρειάστηκαν για να υπολογιστούν τα έξοδα και τα οφέλη αυτών των προτάσεων Η ανάπτυξη χρήσης κρυφής μνήμης Ιστού ξεσήκωσε μελέτες μετρήσεων για τον προσδιορισμό καλών αλγορίθμων αντικατάστασης κρυφής μνήμης στρατηγικών τοποθέτησης κρυφής μνήμης και σχεδιασμού χωρητικότητας κρυφής μνήμης Τελικά ο Ιστός γρήγορα έγινε η βάση για ηλεκτρονικό εμπόριο και έτσι πολλές εταιρίες είχαν ένα οικονομικό ενδιαφέρον στη μέτρηση και επαλήθευση της απόδοσης των συνδυαλλαγών Ιστού και στη διαβεβαίωση ότι κρίσιμοι εξυπηρετητές Ιστού παρέμεναν συνδεδεμένοι χειρίζονταν αιτήσεις γρήγορα και εφοδιάζονταν να χειριστούν υπερτάσεις

Η εργασία στη μέτρηση Ιστού ξεσκέπασε ένα αριθμό ενδιαφερόντων φαινομένων Αυτά περιλαμβάνουν υψηλή μεταβλητότητα σε μεγέθη αντικειμένων Ιστού την εφαρμοσιμότητα του νόμου του Zipf σε σχέση με τις αιτήσεις σε σελίδες Ιστού και τοποθεσίες Ιστού φαινόμενα αστραπιαίου συνωστισμού και τις ιδιότητες διασύνδεσης σελίδων Ιστού που επηρεάζουν την απόδοση των μηχανών αναζήτησης

Ο Ιστός ήταν το πρώτο παράδειγμα μιας εφαρμογής laquoφονιάraquo που ξεσήκωσε και παρακίνησε σημαντική δραστηριότητα μέτρησης από τη μεγάλη του δημοτικότητα Αυτό το πρότυπο έχει στη συνέχεια επαναληφθεί πχ με ομότιμες (peer-to-peer) εφαρμογές και δικτυωμένα παιχνίδια

511

Δικτυακά προσανατολισμένη Μέτρηση Κυκλοφορίας Όπως ήδη αναφέρθηκε η εργασία στη μέτρηση κυκλοφορίας τη δεκαετία του 1990 επικεντρώθηκε κυρίως σε ερωτήματα σχετικά με τον υπολογισμό της απόδοσης Αυτές οι προσπάθειες επικεντρώθηκαν σε μετρήσεις μικρής χρονικής κλίμακας (χιλιοστά του δευτερολέπτου μέχρι ώρες) και επίσης έτειναν να επικεντρωθούν σε μετρήσεις που λήφθηκαν σε ένα μόνο σημείο στο δίκτυο

Ξεκινώντας γύρω στο 2000 η προσοχή της έρευνας στη μέτρηση κυκλοφορίας διευρύνθηκε ώστε να περιλάβει ερωτήματα σχετιζόμενα πιο άμεσα με δικτυακές λειτουργίες και διαχείριση Όπως συζητήθηκε στο Κεφάλαιο 6 αυτά τα ερωτήματα αφορούσαν την κυκλοφορία σε μεγαλύτερες χρονικές κλίμακες (ώρες μέχρι μήνες) και συχνά περιλάμβανε μετρήσεις που έγιναν σε διάφορα σημεία εντός του δικτύου

Ερωτήματα δικτυακά προσανατολισμένης μέτρησης έτειναν να επικεντρωθούν σε θέματα όπως η κατανόηση ενός πίνακα δικτυακής κυκλοφορίας στο χαρακτηρισμό των ημερησίων και εβδομαδιαίων προτύπων κυκλοφοριακής παραλλαγής και στη μελέτη και πρόβλεψη του τρόπου με τον οποίο η κυκλοφορία ενός δικτύου αυξάνεται με το χρόνο Μια σχετική προσπάθεια που άρχισε περίπου τον ίδιο χρόνο επιδίωξε να αντιληφθεί τη συμπεριφορά του γενικού συστήματος δρομολόγησης όπως ελέγχεται μέσω του BGP Οι γενικές ιδιότητες της κυκλοφορίας BGP και οι ειδικοί τρόποι με τους οποίους τα γεγονότα BGP επηρεάζουν χωριστά δίκτυα άρχισαν να μελετώνται στενά

Η προσπάθεια που δαπανήθηκε σε αυτές τις κατευθύνσεις μέτρησης φαίνεται να έχει προέλθει σε μεγάλο μέρος από δικτυακούς χειριστές που αναζήτησαν μια πιο παραδεκτή βάση για δικτυακές λειτουργίες και διαχείριση Μεγάλοι εμπορικοί πάροχοι υπηρεσιών Διαδικτύου είχαν σε πολλές περιπτώσεις βασιστεί σε εξειδικευμένες προσεγγίσεις για λειτουργίες και σχεδιασμό με κάθε πάροχο να αναπτύσσει τις δικές του προσεγγίσεις μέτρησης Αυτοί οι χειριστές ήταν σε λειτουργία για ένα αριθμό ετών (συνήθως από τα τέλη της δεκαετίας του 1980 ή τις αρχές της δεκαετίας του 1990) και κάποιοι άρχισαν να αναζητούν καλύτερα εργαλεία για διαχείριση δικτύων Έτσι η τάση προς δικτυακά προσανατολισμένη μέτρηση κυκλοφορίας που προέκυψε αυτόν τον καιρό ήταν ένα φυσικό αποτέλεσμα των αναγκών δικτυακών χειριστών

Στατιστικός Συμπερασμός Καθώς το ενδιαφέρον στη Διαδικτυακή μέτρηση μεγάλωσε τα τέλη της δεκαετίας του 1990 και τις αρχές της δεκαετίας του 2000 έγινε φανερό ότι πολλά είδη χρήσιμης πληροφορίας ἠταν δύσκολο ή αδύνατο να αποκτηθούν Σε όλο το βιβλίο περιγράψαμε τους διαφόρους τρόπους με τους οποίους πληροφορία για το δίκτυο κρύπτεται από διαχειριστικά όρια επίπεδα πρωτοκόλλων και έλλειψη δυνατοτήτων μέτρησης

Αυτή η κατάσταση σχέσεων παρακίνησε το ενδιαφέρον στο στατιστικό συμπερασμό σαν ένα εργαλείο για υπολογισμό ή αντικατάσταση χαμένων ή μη διαθέσιμων δεδομένων μέτρησης Έρευνα που εφάρμοζε το συμπερασμό σε προβλήματα δικτύωσης άρχισε περί το 1996 με μεθόδους για υπολογισμό πινάκων κυκλοφορίας [Var96] και ακολουθήθηκε το 1999 από εργασία στον υπολογισμό ιδιοτήτων εσωτερικού δικτύου από μετρήσεις από άκρη σε άκρη [CDHT99] Αυτά τα αποτελέσματα παρακίνησαν ένα μεγάλο αριθμό ακόλουθης διερεύνησης και σε νέες στατιστικές μεθόδους και στην εφαρμογή μεθόδων στατιστικού συμπερασμού σε μια ευρεία ποικιλία προβλημάτων μέτρησης

Όπως περιγράφηκε στα κεφάλαια 5 και 6 η χρήση στατιστικού συμπερασμού στη Διαδικτυακή μέτρηση είναι τώρα ευρέως διαδεδομένη Αυτό μπορεί να θεωρηθεί σαν μια φυσική αντίδραση στην έλλειψη παρατηρησιμότητας που υπάρχει σε πολλές πλευρές της Διαδικτυακής αρχιτεκτονικής

Διεπιστημονικοί Σύνδεσμοι Η αύξηση του ενδιαφέροντος σε στατιστικές μεθόδους για την ανάλυση Διαδικτυακών μετρήσεων διεύρυνε την κοινότητα των ερευνητών Διαδικτυακής μέτρησης για να περιλάβει πολλούς στατιστικούς και μαθηματικούς Αρχίζοντας γύρω στο

611

2000 η κοινότητα επεκτάθηκε περισσότερο για να περιλάβει φυσικούς εργαζομένους στη στατιστική φυσική (ονομαζομένη επίσης στατιστική μηχανική)

Η στατιστική φυσική ασχολείται με τις μεγάλης κλίμακας στατιστικές ιδιότητες συλλογών πολλών αλληλεπιδρώντων συστατικών Καθώς το Διαδίκτυο έχει αυξηθεί οι Διαδικτυακές μετρήσεις έχουν γίνει πιο επιδεκτικές στα εργαλεία της στατιστικής φυσικής Πολύ από την εστίαση αυτής της εργασίας ήταν στη μελέτη και κατανόηση των ιδιοτήτων μεγάλων γράφων που προέκυψαν από Διαδικτυακές μετρήσεις (πχ ο γράφος δρομολογητών και ο γράφος AS) Το γενικό πεδίο επίσης αναφέρεται ως σύνθετα δίκτυα στη βιβλιογραφία της φυσικής και περιλαμβάνει μελέτη μεγάλων γράφων που προκύπτουν σε άλλα πεδία όπως η βιολογία και η μηχανική

Η τάση προς προσεγγίσεις στατιστικής φυσικής έχει κατευθυνθεί από μια επιθυμία για κατανόηση των γενικών ή μακροσκοπικών ιδιοτήτων του Διαδικτύου σαν συνάρτηση τοπικών ιδιοτήτων όπως επαγγελματικές αποφάσεις που λαμβάνονται από χωριστούς διαχειριστές δικτύου Αυτή η γραμμή έρευνας δεν έχει ακόμη πλήρως επιτύχει αυτό το σκοπό αλλά έχει παρακινήσει ένα ευρύ φάσμα ερωτημάτων και σημαντική τρέχουσα μελέτη Μια πρόσφατη θεώρηση των Διαδικτυακών μετρήσεων από μια οπτική στατιστικής φυσικής δίνεται στο [PSV04]

112 Δυσκολίες

Οι ευρείες τάσεις στη Διαδικτυακή μέτρηση που μόλις περιγράφηκαν έχουν κατευθυνθεί από μια ποικιλία παραγόντων Αυτές οι τάσεις προέρχονται από μια αλληλεπίδραση σκοπών μέτρησης και δυσκολιών μέτρησης

Σε αυτήν την ενότητα επιθεωρούμε τις κύριες δυσκολίες στη Διαδικτυακή μέτρηση και το πώς επηρεάζουν τάσεις στη Διαδικτυακή μέτρηση Καθένα από αυτά τα αντικέιμενα έχει απαντηθεί πολλές φορές στο βιβλίο σε ποικίλες μορφές αυτή η ενότητα εξυπηρετεί να τις συλλέξει και να τις επιθεωρήσει όλες σε ένα μέρος

Θέματα Διαδικτυακής μέτρησης μπορούν ευρέως να διαχωριστούν σε τέσσερις κατηγορίες πρακτικά θέματα στατιστικές δυσκολίες αρχιτεκτονικά θέματα και διαχειριστικά θέματα

Πρακτικά Θέματα Υπάρχει ένα ευρύ φάσμα πρακτικών προβλημάτων που εξασθενούν τη δυνατότητά μας να μετρήσουμε το Διαδίκτυο

Πρώτα ο καθαρός όγκος των δεδομένων είναι μια σημαντική πρόκληση Θέματα όγκου δεδομένων προκύπτουν σε μετρήσεις κυκλοφορίας σε μετρήσεις εφαρμογής και σε μετρήσεις υποδομής Τα μαζικά σύνολα δεδομένων που μπορούν να συλλεγούν παρουσιάζουν μια πρόκληση για αποθήκευση και επεξεργασία Σε περιπτώσεις όπως μέτρηση τοπολογίας η διαδικασία της συλλογής δεδομένων απαιτεί ένα σημαντικό ποσό χρόνου

Ένας επιδεινωτικός παράγοντας είναι ο ρυθμός αλλαγής των αντικειμένων ή ιδιοτήτων που μετρώνται Το σύστημα μπορεί να αλλάξει κατά τη διάρκεια της χρονικής περιόδου που λαμβάνονται μετρήσεις Για παράδειγμα στη μέτρηση τοπολογίας κεντρικοί υπολογιστές και σύνδεσμοι μπορούν να συνδεθούν και αποσυνδεθούν ενόσω λαμβάνει χώρα η μέτρηση Στη μέτρηση Ιστού το περιεχόμενο μπορεί να αλλάξει κατά τη διάρκεια της πορείας ενός γύρου (crawl) Στη μέτρηση P2P οι ομότιμοι μπορούν να συνδεθούν και να εξαφανιστούν κατά τη διάρκεια της μέτρησης Κατά τη διάρκεια μεγαλυτέρων περιόδων μέτρησης οι μέσοι όροι επιπέδων κυκλοφορίας θα τείνουν να αυξάνουν με το χρόνο και το μίγμα των πρωτοκόλλων και εφαρμογών που χρησιμοποιούνται στο δίκτυο θα μετατοπισθεί (όπως έχει συμβεί σε σχέση με εφαρμογές Ιστού και P2P)

711

Αυτή η σταθερή αλλαγή καθιστά δύσκολη την αναγνώριση laquoαντιπροσωπευτικώνraquo συνθηκών σε πολλές καταστάσεις Ένα συγκεκριμένο μίγμα εφαρμογής ή πρότυπο κυκλοφορίας μπορεί μόνο να είναι αντιπροσωπευτικό ορισμένων ειδών δικτύων ή σε ορισμένους χρόνους Ένα συγκεκριμένο μίγμα τύπων χρηστών ή πελατών θα έτεινε να αλλάζει με το χρόνο καθώς νέοι πελάτες συνδέονται ολόγυρα του κόσμου με διαφορετικούς βαθμούς συνδεσμικότητας

Αυτά τα πρακτικά θέματα παρουσιάζουν προκλήσεις που έχουν αντιμετωπισθεί με μια ποικιλία τρόπων Μετρήσεις εκτελούνται αυξανόμενα χρησιμοποιώντας δειγματοληψία για την ελάττωση του όγκου δεδομένων που συλλέγεται Αυτό είχε οδηγήσει σε ενδιαφέρον προς και ανάπτυξη από μεθόδους για συμπερασμό ιδιοτήτων πρωτοτύπων δεδομένων από δειγματοληπτημένες μετρήσεις Όταν δεν μπορούν να δειγματοληφθούν δεδομένα συστήματα για συλλογή αποθήκευση και διαχείριση μεγάλων συνόλων δεδομένων μπορούν να εφαρμοστούν που κάνουν το πρόβλημα λιγότερο οξύ

Στατιστικά Θέματα Σε όλο το βιβλίο έχουμε δεί ότι η εργασία με Διαδικτυακά δεδομένα περιλαμβάνει ασυνήθεις στατιστικές δυσκολίες

Το πιο εξέχον στατιστικό θέμα στη Διαδικτυακή μέτρηση είναι το φαινόμενο της υψηλής μεταβλητότητας Υψηλή μεταβλητότητα εμφανίζεται στην κυκλοφορία (μήκη ροής και σύνδεσης) στην υποδομή (βαθμός κόμβων στους γράφους δρομολογητών και AS) και στις εφαρμογές (μεγέθη αντικειμένων Ιστού) Οι στατιστικές δυσκολίες της εργασίας με πολύ μεταβλητά δεδομένα έχουν αποκαλυφθεί σε προηγούμενα κεφάλαια περιλαμβάνουν την αστάθεια των παραδοσιακών μετρικών όπως ο εμπειρικός μέσος και η διασπορά την ανάγκη για επικέντρωση σε ουρές κατανομών για σκοπούς χαρακτηρισμού και την μετατόπιση της εστίασης σε ασυνήθη (μακρυών ουρών) πιθανοτικά μοντέλα

Ένα επιπλέον θέμα είναι η σταθερότητα Μετρημένες συνθήκες υπόκεινται σε απροσδόκητη αλλαγή κάθε στιγμή βλάβες εξοπλισμού αστραπιαίοι συνωστισμοί και δικτυακή συντήρηση όλα έχουν το δυναμικό να επηρεάσουν δραστικά τις μετρήσεις σε μια σύντομο περίοδο Αυτό κάνει τη μοντελοποίηση πιο δύσκολη στάσιμα μοντέλα μπορεί να είναι ακατάλληλα όταν μεγάλες αλλαγές στις δικτυακές συνθήκες λαμβάνουν χώρα

Έχουμε δει ότι κάποια μέτρα Διαδικτυακών ιδιοτήτων επιδεικνύουν ισχυρή μνήμη Κυρίως η κυκλοφορία δικτύου δείχνει εξάρτηση μεγάλου βεληνεκούς Αυτό κάνει τη μοντελοποίηση προκλητική απαιτώντας τη χρήση πιο εξεζητημένων μοντέλων στην περιγραφή δικτυακής κυκλοφορίας Η προσομοίωση και ο υπολογισμός απόδοσης είναι επίσης πιο δύσκολα σαν αποτέλεσμα της ισχυρής μνήμης στη δικτυακή κυκλοφορία

Αρχιτεκτονικά Θέματα Ένας αριθμός δυσκολιών στη Διαδικτυακή μέτρηση προέρχονται από ιδιότητες της αρχιτεκτονικής του Διαδικτύου

Η απλότητα πυρήνα αναφέρεται στην ιδέα ότι ενδοδικτυακά στοιχεία (δρομολογητές και μεταγωγείς) πρέπει να είναι σχετικά απλές συσκευές Έχουμε δει ότι ένας τρόπος που τέτοιες συσκευές μπορεί να απλοποιηθούν είναι να παραλειφθούν εξεζητημένες δυνατότητες μέτρησης Έτσι είναι γενικά δύσκολο να αποκτηθεί πληροφορία από δικτυακά στοιχεία σχετικά με μήκη ουρών σε δρομολογητές ή απώλεια και καθυστέρηση χωριστών πακέτων

Μια άλλη διάσταση της απλότητας πυρήνα είναι ότι επίπεδα πρωτοκόλλων πάνω από το IP συχνά δεν ιχνηλατούνται στους δρομολογητές και μεταγωγείς Έτσι για παράδειγμα μπορεί να είναι δύσκολο να παρακολουθηθεί η κυκλοφορία στο επίπεδο ροής ή σε άλλα επίπεδα υψηλότερα από αυτά των πακέτων

Η κλεψύδρα IP επίσης δημιουργεί προβλήματα κρύπτοντας πληροφορία σχετικά με επίπεδα κάτω από το IP Πακέτα μπορούν να περάσουν πάνω από ένα φάσμα διαφορετικών φυσικών μέσων με ιδιότητες που ποικίλουν ευρέως ndash για παράδειγμα ασύρματα LAN οπτική ίνα καλώδιο χαλκού και σύνδεσμοι δορυφόρου Κάποια από αυτά τα μέσα μπορεί να

811

εφαρμόζουν επαναμετάδοση ή διόρθωση εμπροσθίου σφάλματος αποκρύπτοντας τη φθορά πακέτου στο φυσικό επίπεδο Η μέτρηση στο επίπεδο πακέτου (IP) γενικά δεν περιλαμβάνει πληροφορίες σχετικά με λεπτομέρειες όπως αυτές σε χαμηλότερα επίπεδα

Τελικά το γεγονός ότι το Διαδίκτυο έχει μια αποκεντρωμένη οργάνωση σε πολλά επίπεδα σημαίνει ότι δεν υπάρχει πραγματικά κεντρική τοποθεσία στο δίκτυο για σκοπούς παρακολούθησης Για παράδειγμα υπάρχουν πολλά αυτόνομα συστήματα ανωτάτου επιπέδου στο Διαδίκτυο και ένα πακέτο μπορεί να ρεύσει μέσω οποιουδήποτε (ή κανενός) από αυτά Επιπλέον τα αυτόνομα συστήματα ανωτάτου επιπέδου γενικά συνδέονται μεταξύ τους σε πολλαπλές τοποθεσίες Αυτή η πλεγματοειδής δομή σημαίνει ότι μετρήσεις που γίνονται σε κάθε μονό σημείο αναπόφευκτα χάνουν ένα μεγάλο κλάσμα κυκλοφορίας δικτύου

Διαχειριστικά θέματα Όπως είδαμε το Διαδίκτυο είναι ένα δίκτυο δικτύων τα συστατικά δίκτυα κατέχονται και λειτουργούνται από ανεξάρτητες οντότητες ndash τους Παρόχους Υπηρεσιών Δικτύου (ISP) Πολλοί ISP είναι κερδοσκοπικές οντότητες σε ανταγωνισμό μεταξύ τους

Σαν αποτέλεσμα οι ISP αντιστέκονται στη διάθεση σημαντικής πληροφορίας εκτός του οργανισμού τους επειδή αυτή η πληροφορία μπορεί να χρησιμοποιηθεί από τον ανταγωνιστή τους Για παράδειγμα οι ISP γενικά δε δημοσιεύουν πόση κυκλοφορία μεταφέρουν τα δίκτυά τους ή το μέγεθος ή την ακριβή φυσική διάταξη των δικτύων τους ή τη σύνθεση της κυκλοφορίας τους (όπως το μίγμα εφαρμογής ή η διάδοση κακόβουλης κυκλοφορίας)

Η έλλειψη εξωτερικής πληροφορίας σχετικά με ξεχωριστά λειτουργούμενα δίκτυα εμποδίζει πολλούς αξιέπαινους σκοπούς Για παράδειγμα αυτή η μυστικότητα εξασθενεί την ικανότητά μας να ανιχνεύσουμε ξεσπάσματα λογισμικού σκουληκιού (worm) ανά το δίκτυο ή να κατανοήσουμε το ρυθμό αύξησης της δικτυακής κυκλοφορίας παγκοσμίως

113 Μελλοντική Εργασία

Οι δυσκολίες που συγκαταριθμήθηκαν στην τελευταία ενότητα παρέχουν ένα πλαίσιο για την κατανόηση του πώς η μελλοντική Διαδικτυακή μέτρηση θα περιοριστεί και προκληθεί Σε αυτήν την ενότητα ρίχνουμε μια ματιά στις τάσεις μέτρησης που μπορούν να προβλεφθούν στο μέλλον

1131 Ερευνητικές Προκλήσεις Η προσπάθεια να αυξηθεί η Διαδικτυακή κατανόησή μας οδηγεί σε έναν αριθμό

ερευνητικών προκλήσεων Αυτές αντιπροσωπεύουν ερωτήματα σχετικά με το πώς η Διαδικτυακή μέτρηση θα έπρεπε να διεξαχθεί στο μέλλον

Πλατφόρμες Μέτρησης Σε προηγούμενες ενότητες έχουμε δει ότι υπάρχουν πολλές ανικανοποίητες προκλήσεις στη μέτρηση του Διαδικτύου από την άλλη πλευρά η δραστηριότητα στη Διαδικτυακή μέτρηση έχει αυξηθεί δραματικά στα τελευταία χρόνια Αυτά τα δύο γεγονότα δείχνουν ότι φαίνεται αξιόλογο να ανατεθεί αυξημένη προσπάθεια στην κατασκευή πλατφορμών και υποδομής για Διαδικτυακή μέτρηση

Τα έργα που συζητήθηκαν στο Κεφάλαιο 10 δείχνουν ότι ένα φάσμα αρχιτεκτονικών επιλογών είναι δυνατό στην κατασκευή πλατφορμών μέτρησης [EMG] Αυτές οι επιλογές επηρεάζουν τη χρησιμότητα και την μακροπρόθεσμη επιτυχία των προσπαθειών μέτρησης που χρησιμοποιούν αυτές οι πλατφόρμες Κάποιες από τις θεωρήσεις είναι

bull Ποιος θα έπρεπε να χρηματοδοτήσει την υποδομή μέτρησης για το Διαδίκτυο Και κυβερνητικές και εμπορικές προσεγγίσεις είναι δυνατές

bull Θα έπρεπε μια υποδομή μέτρησης να ελεγχθεί από ένα μόνο οργανισμό ή θα έπρεπε ο έλεγχός του να μοιράζεται από πολλαπλούς διερευνητές ή ομάδες

911

bull Πώς θα έπρεπε να χρησιμοποιηθούν τα συστήματα μέτρησης Πώς θα έπρεπε να ληφθούν αποφάσεις αναφορικά με τη σχετική έμφαση σε διαφορετικούς σκοπούς για μια πλατφόρμα μέτρησης

bull Θα έπρεπε να κατασκευαστούν εξειδικευμένες πλατφόρμες μέτρησης ίσως για συγκεκριμένες κοινότητες χρηστών ή για την απάντηση συγκεκριμένων ζητημάτων Αν μια πλατφόρμα πρέπει να είναι γενικής χρήσης τι μορφή θα έπρεπε να πάρει

Η κατασκευή πλατφορμών μέτρησης ευρείας κλίμακας έχει το δυναμικό να κάνει πρόοδο σε θεμελιώδη ανοιχτά ερωτήματα αναφορικά με το Διαδίκτυο Για παράδειγμα η παγκόσμια τοπολογία του Διαδικτύου είναι ανεπαρκώς γνωστή και θα μπορούσε να ερευνηθεί πληρέστερα η φύση και διάδοση κακόβουλης δραστηριότητας στο Διαδίκτυο θα μπορούσε να εκτιμηθεί ακριβέστερα και ο βαθμός στον οποίο η κυκλοφορία αυξάνει και αλλάζει στο Διαδίκτυο θα μπορούσε να κατανοηθεί καλύτερα

Αποτελέσματα Διαμοιραζόμενης Μέτρησης Επίσης σημειώνουμε ότι ένω η απόκτηση Διαδικτυακών μετρήσεων μπορεί να απαιτεί σημαντική προσπάθεια σε πολλές περιπτώσεις μετρήσεις χρησιμοποιούνται μόνο για μια μόνη μελέτη η μόνο από τον οργανισμό που κάνει τις μετρήσεις

Αυτό δείχνει ότι περισσότερη εργασία θα έπρεπε να γίνει για να ξεπεραστούν οι φραγμοί στο συχνό διαμοιρασμό των μετρήσεων ή σχετιζομένων δεδομένων Αυτοί οι φραγμοί περιλαμβάνουν

bull Οι οργανισμοί μπορεί να έχουν μονοπωλιακό ενδιαφέρον σε κάποια είδη δεδομένων που ελέγχουν αλλά όχι σε άλλα Υπάρχει μια ανάγκη για μεθόδους για να γίνουν διαθέσιμες οι μετρήσεις με τρόπους που δεν απελευθερώνουν εμπορικά ευαίσθητη πληροφορία

bull Είναι συχνά μάλλον δύσκολο να τεθούν σύνολα δεδομένων μέτρησης σε μια μορφή που άλλα μπορούν να χρησιμοποιήσουν Είναι σημαντικό να κατανοηθεί και τεκμηριωθεί το πώς έγιναν οι μετρήσεις η ποιότητα των δεδομένων (συμπεριλαμβανομένης της σημείωσης του ποιά σημεία δεδομένων είναι εσφαλμένα) η μορφή των δεδομένων και οι υποθέσεις που υπόκεινται της συλλογής δεδομένων Αυτή η προσπάθεια παίρνει χρόνο

bull Η αποθήκευση και η κατανομή μεγάλων συνόλων δεδομένων μπορεί να απαιτεί σημαντκούς πόρους συμπεριλαμβανομένων του χώρου δίσκου και της χωρητικότητας δικτύου Αυτοί οι πόροι είναι ακριβοί και η χρήση τους πρέπει να δικαιολογηθεί

Η έρευνα σε αυτήν την περιοχή είναι σημαντική επειδή ο διαμοιρασμός μετρήσεων έχει πολλές ωφέλειες Σημαίνει ότι η προσπάθεια στην απόκτηση μετρήσεων ξεπληρώνεται με πολλαπλές χρήσεις Επιτρέπει τα ερευνητικά αποτελέσματα που βασίζονται στην ανάλυση των δεδομένων να επαληθευτούν ανεξάρτητα Και επιτρέπει νέα ερωτήματα να ερωτηθούν ερωτήματα που μπορεί να μην ήταν η βάση για την πρωτότυπη προσπάθεια μέτρησης

1132 Αναδυόμενα Ερωτήματα Ολοκληρώνοντας το βιβλίο είναι φυσικό να ερωτούμε ποια είναι τα επόμενα βήματα στη

Διαδικτυακή μέτρηση Πού πηγαίνει το πεδίο και ποια αναδυόμενα ερωτήματα μπορούν να προβλεφθούν Βεβαίως είναι αδύνατο να απαντηθούν πλήρως αυτές οι ερωτήσεις αλλά σε αυτήν την ενότητα προτείνουμε κάποιες μερικές απαντήσεις Χωρίζουμε τα θέματα σε βραχυπρόθεσμα και πιο μακροπρόθεσμα ερωτήματα μέτρησης

Βραχυπρόθεσμα Αυτό το βιβλίο έχει καλύψει ένα ευρύ φάσμα θεμάτων στη Διαδικτυακή μέτρηση Τα υποπεδία της υποδομής κυκλοφορίας και μέτρησης εφαρμογής είναι το καθένα σύνθετο αυτό καθαυτό Επιπλέον οι σχετιζόμενες περιοχές της ανωνυμοποίησης και ασφάλειας περιέχουν πολλά προσθέτα θέματα Παρόλα αυτά υπάρχουν περισσότερα στη

1011

Διαδικτυακή μέτρηση που μπορούν να προβλεφθούν στο κοντινό μέλλον Πολλά από αυτά τα θέματα αρχίζουν να μελετώνται αλλά δεν είναι ακόμη αναπτυγμένα ή αρκετά ώριμα για να καλυφθούν σε αυτό το βιβλίο

Η περιοχή των μετρήσεων ασυρμάτου Διαδικτύου είναι μια σημαντική αναδυόμενη περιοχή Από τη μία πλευρά η μετάδοση ασυρμάτων δεδομένων έχει χρησιμοποιηθεί στο Διαδίκτυο από τις πρώτες του μέρες ως το ARPANET Όμως στα πρώτα πειράματα του ARPANET ασύρματοι σύνδεσμοι χρησιμοποιήθηκαν για συνδέσεις δικτύου κορμού σε μακρινές τοποθεσίες συνήθως μέσω δορυφόρου Σε αντίθεση η σημασία των ασυρμάτων συνδέσμων έχει αυξηθεί δραματικά πιο πρόσφατα με την εισαγωγή της τεχνολογίας ασυρμάτων LAN Οι πιο αξιοσημείωτοι από αυτούς είναι τα πρωτόκολλα που βασίζονται στο σύνολο προτύπων IEEE 80211 (πχ WiFi)

Η φύση της ασύρματης μέτρησης είναι μάλλον διαφορετική από τη μέτρηση του ενσύρματου Διαδικτύου Η ασύρματη μέτρηση βασίζεται στη σύλληψη μετάδοσης ραδιοκυμάτων Αυτό σημαίνει ότι η ακριβής ασύρματη μέτρηση και η σωστή μετάφραση αυτών των μετρήσεων περιλαμβάνει νέα θέματα και περιορισμούς Σαν αποτέλεσμα το πεδίο της ασύρματης Διαδικτυακής μέτρησης είναι ακόμη σε υπό διαμόρφωσιν στάδια σχετικά λίγες καθοριστικές μελέτες έχουν διεξαχθεί ως τώρα

Μια άλλη αναδυόμενη περιοχή είναι τα δίκτυα αισθητήρα Αυτά είναι δίκτυα συσκευών χαμηλής ισχύος που αναμένεται να σχηματίσουν δίκτυα χωρίς σημαντική υποδομιακή υποστήριξη Υπάρχουν σημαντικά θέματα μέτρησης σχετιζόμενα με αυτά τα δίκτυα Όμως το πεδίο είναι ακόμη νεότερο από αυτό της ασυρμάτου δικτύωσης γενικά και η εργασία δεν είναι ακόμη ώριμη σε αυτήν την περιοχή

Γυρίζοντας στο ενσύρματο Διαδίκτυο ένα θέμα που δεν έχει ακόμη μελετηθεί σε βάθος είναι μετρήσεις δικτύων και κυκλοφορίας IPv6 Ενώ το πρωτόκολλο IPv6 έχει λειτουργήσει για ένα αριθμό ετών η υιοθέτηση του δεν είναι ακόμη ευρέως διαδεδομένη Σε πολλά σημεία η συμπεριφορά του IPv6 διαφέρει από το IPv4 σε μόνο λίγα σημεία αναφορικά με τις μετρήσεις έτσι δεν έχουμε εστιάσει στο IPv6 σε μεγάλο βαθμό στο βιβλίο Όμως καθώς το IPv6 γίνεται πιο ευρέως διαδεδομένο είναι πιθανό ότι νέα θέματα μέτρησης θα προκύψουν

Επιπρόσθετα όπως σημειώθηκε παραπάνω η σουίτα των εφαρμογών που χρησιμοποιούνται στο Διαδίκτυο είναι σε μια συνεχή ρευστότητα Ενώ μπορούμε να αναγνωρίσουμε γενικά μετατοπίσεις στους κυρίαρχους τύπους εφαρμογών πχ από τον Ιστό στο P2P υπάρχουν επίσης σημαντικές δευτερεύουσες μετατοπίσεις Για παράδειγμα εντός του συνόλου εφαρμογής P2P πρώιμες εφαρμογές όπως το KaZaa έχουν παραχωρήσει προτεραιότητα σε πιο πρόσφατες παραλλαγές όπως το BitTorrent Αυτές οι εφαρμογές είναι αρκετά διαφορετικές σε πολλά σημεία και αυτές οι μετατοπίσεις από μια κυρίαρχη εφαρμογή σε μια άλλη έχουν ένα σημαντικό αποτέλεσμα στη φύση της κυκλοφορίας Κοιτάζοντας στο μέλλον δικτυωμένα παιχνίδια έχουν το δυναμικό να γίνουν μια κυρίαρχη εφαρμογή (τουλάχιστον υπό όρους χρηστών αν όχι υπό όρους συνολικής κυκλοφορίας) Έχουμε προσπαθήσει να δώσουμε έμφαση στα μακροχρόνια αποτελέσματα στην περιοχή των Διαδικτυακών εφαρμογών Όμως καθώς νέες εφαρμογές αναδύονται θα υπάρξει μια φυσική μετατόπιση στην εστίαση της προσοχής μέτρησης

Τελικά έχουμε σημειώσει ότι υπάρχει σημαντικό ενδιαφέρον σε στατιστικά μοντέλα φυσικής για ιδιότητες Διαδικτύου Αυτή είναι μια περιοχή έρευνας που συχνά γεφυρώνει επιπλέον θέματα στη βιοπληροφορική κοινωνιολογία και μηχανική Δεν είχαμε το χώρο να καλύψουμε αυτό το ευρύτερο σύνολο θεμάτων Όμως έχουμε δώσει μια επισκόπηση των συνεισφορών της στατιστικής φυσικής μέχρι σήμερα στη Διαδικτυακή μοντελοποίηση και έχουμε δώσει αναφορές σε αυτήν την ερευνητική βιβλιογραφία όπου είναι σχετικό Δραστηριότητα σε αυτήν την περιοχή πιθανό να συνεχίσει και αυξηθεί στο κοντινό μέλλον

1111

Πιο Μακροπρόθεσμα Μια από τις πιο ανοικτού τέλους μελλοντικές κατευθύνσεις αφορά το τι και πώς νέα ερωτήματα θα αναδυθούν στη Διαδικτυακή μέτρηση Έχουμε δει ότι τα είδη των ερωτημάτων που διευθετήθηκαν στη Διαδικτυακή μέτρηση έχουν εξελιχθεί με το χρόνο σε πολλές περιπτώσεις η ανάδυση νέων ερωτημάτων ήταν δύσκολο να προβλεφθεί

Για παράδειγμα η έκρηξη του Παγκοσμίου Ιστού από τις αρχές ως τα μέσα της δεκαετίας του 1990 προκάλεσαν ένα τεράστιο ποσό έρευνας Από τη μια πλευρά αυτή η έρευνα ήταν κυρίως κατευθυνόμενη από τη δημοτικότητα του Ιστού ndash για παράδειγμα ένας αριθμός κατανεμημένων πληροφοριακών συστημάτων προϋπήρξε του Ιστού αλλά αυτά δεν υπόκειντο σε σημαντική προσοχή μέτρησης Από την άλλη πλευρά αυτή η έρευνα επέδειξε έναν αριθμό αποτελεσμάτων που μπορεί να θεωρηθούν θεμελιώδη όπως η παρουσία υψηλής μεταβλητότητας στα μεγέθη και τη δημοτικότητα των αντικειμένων Ιστού

Αυτό το παράδειγμα δείχνει ότι κάποια πιο μακροπρόθεσμα αναδυόμενα ερωτήματα μπορεί να κατευθυνθούν από νέες laquoεφαρμογές φονείςraquo ή από νέους τρόπους χρήσης του Διαδικτύου Αυτά είναι εξ ορισμού δύσκολο να προβλεφθούν

Ένα άλλο σύνολο πιο μακροπρόθεσμων ερωτημάτων αφορά την αυξανόμενη ενσωμάτωση του Διαδικτύου στην κοινωνία Ως τέτοια νέα ερωτήματα μέτρησης θα προκύψουν αναμφισβήτητα σε σχέση με την ανθρώπινη δραστηριότητα Για παράδειγμα καθώς η χρήση του Διαδικτύου έχει αυξηθεί στο εμπόριο υπάρχει αυξανόμενη σπουδαιότητα στην κατανόηση κακόβουλης δραστηριότητας τη μέτρηση γεωγραφικής τοποθεσίας και τη διερεύνηση της σχέσης μεταξύ της οικονομικής ανάπτυξης και της Διαδικτυακής υποδομής Αυτά τα ερωτήματα αρχίζουν να διευθετούνται μέσω εργασίας στην ασφάλεια την ανωνυμοποίηση και άλλα πεδία αλλά υπάρχουν αναμφίβολα πολλά σημαντικά ερωτήματα ακόμη να αναδυθούν

Βιβλιογραφία

Crovella M Krishnamurthy B 2006 Internet Measurement Infrastructure Traffic and Applications John Wiley amp Sons Inc 2006

ΤΕΛΟΣ ΚΑΙ Τῼ ΘΕῼ ΔΟΞΑ

  • 111 Τάσεις στη Διαδικτυακή Μέτρηση
  • 112 Δυσκολίες
  • 113 Μελλοντική Εργασία
    • 1131 Ερευνητικές Προκλήσεις
    • 1132 Αναδυόμενα Ερωτήματα
      • Βιβλιογραφία
Page 3: Μετάφραση τοῦ κεφαλαίου 11 τοῦ βιβλίου «Internet Measurement: Infrastructure, Traffic and Applications» [Translation of chapter 11 of the book «Internet

311

μετρήσουν απευθείας την κυκλοφοριακή ροή μεταξύ δύο οποιονδήποτε κόμβων και την ικανότητα να ρωτήσουν δρομολογητές για τα άμεσα στατιστικά του φορτίου εργασίας τους Ὀπως έχουμε δει στα Κεφάλαια 5 και 6 αυτά τα είδη χαρακτηριστικών είτε λείπουν ή είναι πολύ δύσκολο να χρησιμοποιηθούν στο σημερινό Διαδίκτυο

Τι συνέβη Καθώς το ARPANET αυξήθηκε έχασε τις περισσότερες εγγενείς δυνατότητες μέτρησης Μέχρι το 1975 οι δικτυακές μετρήσεις συντονίστηκαν και συλλέχθηκαν σε ένα μόνο Κέντρο Δικτυακής Μέτρησης (Network Measurement Center - NMC)) στο UCLA Μετά το 1975 ο διαχειριστικός έλεγχος του ARPANET αναλήφθηκε από την Αμυντική Υπηρεσία Επικοινωνιών και οι εκτενής μετρήση του ARPANET έπαυσε Ταυτόχρονα μια νέα γενιά από IMP αναπτύχθηκε και αυτοί ίσως να μην περιείχαν τις ίδιες ενσωματωμένες δυνατότητες μέτρησης που οι αρχικοί IMP κατείχαν

Η εξέλιξη του δικτύου μακρυά από την εκτενή αυτομέτρηση φαίνεται να έχει αναπτυχθεί για πολλούς λόγους Το δίκτυο αυξανόταν σε μέγεθος και η λειτουργία του γινόταν πιο προσανατολισμένη στην παροχή συνδεσιμότητας από ότι στην υποστήριξη έρευνας εναλλαγής πακέτων Από την άλλη πλευρά το δίκτυο δεν ήταν τόσο μεγάλο ώστε να χρειάζεται εκτενής μέτρηση για λειτουργικούς σκοπούς Τελικά η ενσωματωμένη αυτομέτρηση καθιστά συνθετότερη τη σχεδίαση και ακριβότερες τις δικτυακές συσκευές το οποίο ίσως να ήταν ένας παράγοντας επίσης

Λειτουργικές Μετρήσεις Μέχρι τα μέσα του 1980 το δίκτυο μεγάλωνε και πολλοί ανεξάρτητοι οργανισμοί αγόραζαν δικτυακό εξοπλισμό που χρειάζονταν για να λειτουργούν και να διοικούν Γινόταν φανερό ότι χρειαζόταν μία πρότυπη δυνατότητα παρακολούθησης Μία ποικιλία εταιρειών κατασκεύαζε Διαδικτυακό υλικό για εμπορική πώληση και χρειαζόταν ενιαίες μέθοδοι για τη διαχείριση συσκευών που αγοράστηκαν από διαφορετικούς παροχείς Το 1987 άρχισε εργασία στο SNMP και ο ορισμός του SNMP v1 τελείωσε το 1988 Το SNMP γρήγορα έγινε η πρότυπη μέθοδος για την απόκτηση πληροφορίας σχετικά με την κατάσταση και τη λειτουργία των δικτυακών στοιχείων

Επιπλέον η ανάγκη να κατανοηθεί η ευρείας κλίμακος συμπεριφορά του δικτύου γινόταν ένα θέμα Όταν δύο κεντρικοί υπολογιστές ήταν ανίκανοι να επικοινωνήσουν ήταν συχνά δύσκολο να καθοριστεί η τοποθεσία του προβλήματος Το 1988 γράφτηκε η πρώτη έκδοση του traceroute Όπως περιγράφηκε στο Κεφάλαιο 5 το traceroute χρησιμοποιεί μηνύματα TIME EXCEEDED του ICMP για να ανακαλύψει διεπαφές σε κάθε δρομολογητή κατά μήκος μιας διαδρομής Το πρωτόκολλο ICMP δε σχεδιάστηκε ρητά για να υποστηρίξει ανακάλυψη τοπολογίας Όμως η ανάγκη για αποσφαλμάτωση προβλημάτων συνδεσμικότητας είχε γίνει τόσο μεγάλη που το traceroute υιοθετήθηκε σύντομα ευρέως

Έτσι οι τάσεις της αύξησης της δικτυακής κλίμακας συνδυασμένες με την εμφάνιση μιας εμπορικής αγοράς για δικτυακό εξοπλισμό προώθησε ένα νέο είδος δικτυακής μέτρησης λειτουργικά οδηγούμενες μετρήσεις σχεδιασμένες να εξυπηρετήσουν τη διαχείριση και τη διάγνωση σφαλμάτων

Μέτρηση Κυκλοφορίας Υψηλής ταχύτητας Μέχρι τις αρχές του 1990 οι στατιστικές ιδιότητες της δικτυακής κυκλοφορίας εμφανίζονταν σαν ένα σημαντικό ζήτημα Νέες δικτυακές τεχνολογίες όπως δρομολογητές υψηλής ταχύτητας και μεταγωγείς Ασύγχρονης Κατάστασης Μεταφοράς (Asynchronous Transfer Mode - ATM) αναπτύσσονταν Οι στατιστικές ιδιότητες της δικτυακής κυκλοφορίας έχουν ισχυρή επίδραση στη σχεδίαση τη ρύθμιση και τον υπολογισμό απόδοσης αυτού του είδους εξοπλισμού Συγκεκριμένα οι μεταγωγείς ATM αναπτύσσονταν με το σκοπό της υποστήριξης επικοινωνίας δεδομένων και φωνής Οι στατιστικές ιδιότητες κυκλοφορίας φωνής κατανοήθηκαν καλά σαν αποτέλεσμα δεκαετιών μέτρησης Όμως ενώ οι βασικές ιδιότητες κυκλοφορίας δικτυακών δεδομένων

411

συχνά θεωρήθηκαν παρόμοιες σε κυκλοφορία φωνής στην πραγματικότητα ήταν πολύ λιγότερο κατανοητές

Σαν αποτέλεσμα συστήματα για υψηλής ταχύτητας σύλληψη πακέτων αναπτύχθηκαν και παρατάχθηκαν σε δικτυακά εργαστήρια Η επόμενη στατιστική ανάλυση αυτών των μαζικών συνόλων δεδομένων παρείχε τη βάση για την ανάπτυξη αυτομοίων μοντέλων κυκλοφορίας όπως περιγράφτηκε στο Κεφάλαιο 6 Τα αυτόμοια μοντέλα είναι πολύ διαφορετικά από τα μοντέλα που χρησιμοποιούνται για να περιγράψουν κυκλοφορία φωνής και η ευρεία χρήση τους αναπαριστά μια θεμελιώδη αλλαγή στον τρόπο που χαρακτηρίζεται η Διαδικτυακή κυκλοφορία

Αυτή η εξέλιξη αναπαριστά την έναρξη της λεπτομερούς ανάλυσης πολύ μεγάλων σύνολων δεδομένων σε σχέση με τη Διαδικτυακή μέτρηση Σε όλο το βιβλίο είδαμε ότι τα προβλήματα που σχετίζονταν με τη σύλληψη και ανάλυση μαζικών όγκων δεδομένων είναι τώρα μια καθημερινή μέριμνα στη Διαδικτυακή μέτρηση

Η μέτρηση και ανάλυση κυκλοφορίας υψηλής ταχύτητας επίσης αντιπροσώπευσαν τις απαρχές μιας άλλης διεισδυτικής τάσης στη Διαδικτυακή μέτρηση τη μεταχείριση του Διαδικτύου σαν αντικείμενο επιστημονικής μελέτης Η ανάπτυξη αυτομοίων μοντέλων κυκλοφορίας μεταχειρίστηκε τη δικτυακή κυκλοφορία σαν ένα άγνωστο αντικείμενο που χρειαζόταν να χαρακτηριστεί και να κατανοηθεί και οι ασυνήθεις πλευρές αυτομοιότητας πυροδότησαν ένα μεγάλο ποσό επακόλουθης μέτρησης και ανάλυσης Έτσι η ανάλυση της κυκλοφορίας υψηλής ταχύτητας διεύρυνε την εστίαση στη δικτυακή μέτρηση για να περιλάβει ερευνητικά ερωτήματα μια εστίαση που ήταν κατά μέγα μέρος απούσα από τα μέσα του 1970

Μέτρησεις Ιστού και Εφαρμογής Η έκρηξη του Παγκοσμίου Ιστού που ξεκίνησε γύρω στο 1994 ξεσήκωσε σημαντικό ενδιαφέρον στις περιοχές των φορτίων εργασίας Ιστού Από τότε που ο Ιστός γρήγορα έγινε η κυρίαρχη εφαρμογή στο Διαδίκτυο με όρους ποσότητας κυκλοφορίας οι ιδιότητες των φορτίων εργασίας Ιστού ήταν σημαντικές για την κατανόηση των αποτελεσμάτων τους στη Διαδικτυακή κυκλοφορία Επιπλέον οι μετρήσεις Ιστού χρειάζονταν να υπολογίσουν θέματα απόδοσης και να υπολογίσουν προτεινόμενες αλλαγές σχεδίου σε εξυπηρέτες Ιστού και πρωτόκολλα

Ὀπως συζητήθηκε στο Κεφάλαιο 7 οι προσπάθειες μέτρησης Ιστού ακολούθησαν ένα αριθμό διαφορετικών ωθήσεων Μια ποικιλία βελτιώσεων στο πρωτόκολλο HTTP προτάθηκαν και μετρήσεις χρειάστηκαν για να υπολογιστούν τα έξοδα και τα οφέλη αυτών των προτάσεων Η ανάπτυξη χρήσης κρυφής μνήμης Ιστού ξεσήκωσε μελέτες μετρήσεων για τον προσδιορισμό καλών αλγορίθμων αντικατάστασης κρυφής μνήμης στρατηγικών τοποθέτησης κρυφής μνήμης και σχεδιασμού χωρητικότητας κρυφής μνήμης Τελικά ο Ιστός γρήγορα έγινε η βάση για ηλεκτρονικό εμπόριο και έτσι πολλές εταιρίες είχαν ένα οικονομικό ενδιαφέρον στη μέτρηση και επαλήθευση της απόδοσης των συνδυαλλαγών Ιστού και στη διαβεβαίωση ότι κρίσιμοι εξυπηρετητές Ιστού παρέμεναν συνδεδεμένοι χειρίζονταν αιτήσεις γρήγορα και εφοδιάζονταν να χειριστούν υπερτάσεις

Η εργασία στη μέτρηση Ιστού ξεσκέπασε ένα αριθμό ενδιαφερόντων φαινομένων Αυτά περιλαμβάνουν υψηλή μεταβλητότητα σε μεγέθη αντικειμένων Ιστού την εφαρμοσιμότητα του νόμου του Zipf σε σχέση με τις αιτήσεις σε σελίδες Ιστού και τοποθεσίες Ιστού φαινόμενα αστραπιαίου συνωστισμού και τις ιδιότητες διασύνδεσης σελίδων Ιστού που επηρεάζουν την απόδοση των μηχανών αναζήτησης

Ο Ιστός ήταν το πρώτο παράδειγμα μιας εφαρμογής laquoφονιάraquo που ξεσήκωσε και παρακίνησε σημαντική δραστηριότητα μέτρησης από τη μεγάλη του δημοτικότητα Αυτό το πρότυπο έχει στη συνέχεια επαναληφθεί πχ με ομότιμες (peer-to-peer) εφαρμογές και δικτυωμένα παιχνίδια

511

Δικτυακά προσανατολισμένη Μέτρηση Κυκλοφορίας Όπως ήδη αναφέρθηκε η εργασία στη μέτρηση κυκλοφορίας τη δεκαετία του 1990 επικεντρώθηκε κυρίως σε ερωτήματα σχετικά με τον υπολογισμό της απόδοσης Αυτές οι προσπάθειες επικεντρώθηκαν σε μετρήσεις μικρής χρονικής κλίμακας (χιλιοστά του δευτερολέπτου μέχρι ώρες) και επίσης έτειναν να επικεντρωθούν σε μετρήσεις που λήφθηκαν σε ένα μόνο σημείο στο δίκτυο

Ξεκινώντας γύρω στο 2000 η προσοχή της έρευνας στη μέτρηση κυκλοφορίας διευρύνθηκε ώστε να περιλάβει ερωτήματα σχετιζόμενα πιο άμεσα με δικτυακές λειτουργίες και διαχείριση Όπως συζητήθηκε στο Κεφάλαιο 6 αυτά τα ερωτήματα αφορούσαν την κυκλοφορία σε μεγαλύτερες χρονικές κλίμακες (ώρες μέχρι μήνες) και συχνά περιλάμβανε μετρήσεις που έγιναν σε διάφορα σημεία εντός του δικτύου

Ερωτήματα δικτυακά προσανατολισμένης μέτρησης έτειναν να επικεντρωθούν σε θέματα όπως η κατανόηση ενός πίνακα δικτυακής κυκλοφορίας στο χαρακτηρισμό των ημερησίων και εβδομαδιαίων προτύπων κυκλοφοριακής παραλλαγής και στη μελέτη και πρόβλεψη του τρόπου με τον οποίο η κυκλοφορία ενός δικτύου αυξάνεται με το χρόνο Μια σχετική προσπάθεια που άρχισε περίπου τον ίδιο χρόνο επιδίωξε να αντιληφθεί τη συμπεριφορά του γενικού συστήματος δρομολόγησης όπως ελέγχεται μέσω του BGP Οι γενικές ιδιότητες της κυκλοφορίας BGP και οι ειδικοί τρόποι με τους οποίους τα γεγονότα BGP επηρεάζουν χωριστά δίκτυα άρχισαν να μελετώνται στενά

Η προσπάθεια που δαπανήθηκε σε αυτές τις κατευθύνσεις μέτρησης φαίνεται να έχει προέλθει σε μεγάλο μέρος από δικτυακούς χειριστές που αναζήτησαν μια πιο παραδεκτή βάση για δικτυακές λειτουργίες και διαχείριση Μεγάλοι εμπορικοί πάροχοι υπηρεσιών Διαδικτύου είχαν σε πολλές περιπτώσεις βασιστεί σε εξειδικευμένες προσεγγίσεις για λειτουργίες και σχεδιασμό με κάθε πάροχο να αναπτύσσει τις δικές του προσεγγίσεις μέτρησης Αυτοί οι χειριστές ήταν σε λειτουργία για ένα αριθμό ετών (συνήθως από τα τέλη της δεκαετίας του 1980 ή τις αρχές της δεκαετίας του 1990) και κάποιοι άρχισαν να αναζητούν καλύτερα εργαλεία για διαχείριση δικτύων Έτσι η τάση προς δικτυακά προσανατολισμένη μέτρηση κυκλοφορίας που προέκυψε αυτόν τον καιρό ήταν ένα φυσικό αποτέλεσμα των αναγκών δικτυακών χειριστών

Στατιστικός Συμπερασμός Καθώς το ενδιαφέρον στη Διαδικτυακή μέτρηση μεγάλωσε τα τέλη της δεκαετίας του 1990 και τις αρχές της δεκαετίας του 2000 έγινε φανερό ότι πολλά είδη χρήσιμης πληροφορίας ἠταν δύσκολο ή αδύνατο να αποκτηθούν Σε όλο το βιβλίο περιγράψαμε τους διαφόρους τρόπους με τους οποίους πληροφορία για το δίκτυο κρύπτεται από διαχειριστικά όρια επίπεδα πρωτοκόλλων και έλλειψη δυνατοτήτων μέτρησης

Αυτή η κατάσταση σχέσεων παρακίνησε το ενδιαφέρον στο στατιστικό συμπερασμό σαν ένα εργαλείο για υπολογισμό ή αντικατάσταση χαμένων ή μη διαθέσιμων δεδομένων μέτρησης Έρευνα που εφάρμοζε το συμπερασμό σε προβλήματα δικτύωσης άρχισε περί το 1996 με μεθόδους για υπολογισμό πινάκων κυκλοφορίας [Var96] και ακολουθήθηκε το 1999 από εργασία στον υπολογισμό ιδιοτήτων εσωτερικού δικτύου από μετρήσεις από άκρη σε άκρη [CDHT99] Αυτά τα αποτελέσματα παρακίνησαν ένα μεγάλο αριθμό ακόλουθης διερεύνησης και σε νέες στατιστικές μεθόδους και στην εφαρμογή μεθόδων στατιστικού συμπερασμού σε μια ευρεία ποικιλία προβλημάτων μέτρησης

Όπως περιγράφηκε στα κεφάλαια 5 και 6 η χρήση στατιστικού συμπερασμού στη Διαδικτυακή μέτρηση είναι τώρα ευρέως διαδεδομένη Αυτό μπορεί να θεωρηθεί σαν μια φυσική αντίδραση στην έλλειψη παρατηρησιμότητας που υπάρχει σε πολλές πλευρές της Διαδικτυακής αρχιτεκτονικής

Διεπιστημονικοί Σύνδεσμοι Η αύξηση του ενδιαφέροντος σε στατιστικές μεθόδους για την ανάλυση Διαδικτυακών μετρήσεων διεύρυνε την κοινότητα των ερευνητών Διαδικτυακής μέτρησης για να περιλάβει πολλούς στατιστικούς και μαθηματικούς Αρχίζοντας γύρω στο

611

2000 η κοινότητα επεκτάθηκε περισσότερο για να περιλάβει φυσικούς εργαζομένους στη στατιστική φυσική (ονομαζομένη επίσης στατιστική μηχανική)

Η στατιστική φυσική ασχολείται με τις μεγάλης κλίμακας στατιστικές ιδιότητες συλλογών πολλών αλληλεπιδρώντων συστατικών Καθώς το Διαδίκτυο έχει αυξηθεί οι Διαδικτυακές μετρήσεις έχουν γίνει πιο επιδεκτικές στα εργαλεία της στατιστικής φυσικής Πολύ από την εστίαση αυτής της εργασίας ήταν στη μελέτη και κατανόηση των ιδιοτήτων μεγάλων γράφων που προέκυψαν από Διαδικτυακές μετρήσεις (πχ ο γράφος δρομολογητών και ο γράφος AS) Το γενικό πεδίο επίσης αναφέρεται ως σύνθετα δίκτυα στη βιβλιογραφία της φυσικής και περιλαμβάνει μελέτη μεγάλων γράφων που προκύπτουν σε άλλα πεδία όπως η βιολογία και η μηχανική

Η τάση προς προσεγγίσεις στατιστικής φυσικής έχει κατευθυνθεί από μια επιθυμία για κατανόηση των γενικών ή μακροσκοπικών ιδιοτήτων του Διαδικτύου σαν συνάρτηση τοπικών ιδιοτήτων όπως επαγγελματικές αποφάσεις που λαμβάνονται από χωριστούς διαχειριστές δικτύου Αυτή η γραμμή έρευνας δεν έχει ακόμη πλήρως επιτύχει αυτό το σκοπό αλλά έχει παρακινήσει ένα ευρύ φάσμα ερωτημάτων και σημαντική τρέχουσα μελέτη Μια πρόσφατη θεώρηση των Διαδικτυακών μετρήσεων από μια οπτική στατιστικής φυσικής δίνεται στο [PSV04]

112 Δυσκολίες

Οι ευρείες τάσεις στη Διαδικτυακή μέτρηση που μόλις περιγράφηκαν έχουν κατευθυνθεί από μια ποικιλία παραγόντων Αυτές οι τάσεις προέρχονται από μια αλληλεπίδραση σκοπών μέτρησης και δυσκολιών μέτρησης

Σε αυτήν την ενότητα επιθεωρούμε τις κύριες δυσκολίες στη Διαδικτυακή μέτρηση και το πώς επηρεάζουν τάσεις στη Διαδικτυακή μέτρηση Καθένα από αυτά τα αντικέιμενα έχει απαντηθεί πολλές φορές στο βιβλίο σε ποικίλες μορφές αυτή η ενότητα εξυπηρετεί να τις συλλέξει και να τις επιθεωρήσει όλες σε ένα μέρος

Θέματα Διαδικτυακής μέτρησης μπορούν ευρέως να διαχωριστούν σε τέσσερις κατηγορίες πρακτικά θέματα στατιστικές δυσκολίες αρχιτεκτονικά θέματα και διαχειριστικά θέματα

Πρακτικά Θέματα Υπάρχει ένα ευρύ φάσμα πρακτικών προβλημάτων που εξασθενούν τη δυνατότητά μας να μετρήσουμε το Διαδίκτυο

Πρώτα ο καθαρός όγκος των δεδομένων είναι μια σημαντική πρόκληση Θέματα όγκου δεδομένων προκύπτουν σε μετρήσεις κυκλοφορίας σε μετρήσεις εφαρμογής και σε μετρήσεις υποδομής Τα μαζικά σύνολα δεδομένων που μπορούν να συλλεγούν παρουσιάζουν μια πρόκληση για αποθήκευση και επεξεργασία Σε περιπτώσεις όπως μέτρηση τοπολογίας η διαδικασία της συλλογής δεδομένων απαιτεί ένα σημαντικό ποσό χρόνου

Ένας επιδεινωτικός παράγοντας είναι ο ρυθμός αλλαγής των αντικειμένων ή ιδιοτήτων που μετρώνται Το σύστημα μπορεί να αλλάξει κατά τη διάρκεια της χρονικής περιόδου που λαμβάνονται μετρήσεις Για παράδειγμα στη μέτρηση τοπολογίας κεντρικοί υπολογιστές και σύνδεσμοι μπορούν να συνδεθούν και αποσυνδεθούν ενόσω λαμβάνει χώρα η μέτρηση Στη μέτρηση Ιστού το περιεχόμενο μπορεί να αλλάξει κατά τη διάρκεια της πορείας ενός γύρου (crawl) Στη μέτρηση P2P οι ομότιμοι μπορούν να συνδεθούν και να εξαφανιστούν κατά τη διάρκεια της μέτρησης Κατά τη διάρκεια μεγαλυτέρων περιόδων μέτρησης οι μέσοι όροι επιπέδων κυκλοφορίας θα τείνουν να αυξάνουν με το χρόνο και το μίγμα των πρωτοκόλλων και εφαρμογών που χρησιμοποιούνται στο δίκτυο θα μετατοπισθεί (όπως έχει συμβεί σε σχέση με εφαρμογές Ιστού και P2P)

711

Αυτή η σταθερή αλλαγή καθιστά δύσκολη την αναγνώριση laquoαντιπροσωπευτικώνraquo συνθηκών σε πολλές καταστάσεις Ένα συγκεκριμένο μίγμα εφαρμογής ή πρότυπο κυκλοφορίας μπορεί μόνο να είναι αντιπροσωπευτικό ορισμένων ειδών δικτύων ή σε ορισμένους χρόνους Ένα συγκεκριμένο μίγμα τύπων χρηστών ή πελατών θα έτεινε να αλλάζει με το χρόνο καθώς νέοι πελάτες συνδέονται ολόγυρα του κόσμου με διαφορετικούς βαθμούς συνδεσμικότητας

Αυτά τα πρακτικά θέματα παρουσιάζουν προκλήσεις που έχουν αντιμετωπισθεί με μια ποικιλία τρόπων Μετρήσεις εκτελούνται αυξανόμενα χρησιμοποιώντας δειγματοληψία για την ελάττωση του όγκου δεδομένων που συλλέγεται Αυτό είχε οδηγήσει σε ενδιαφέρον προς και ανάπτυξη από μεθόδους για συμπερασμό ιδιοτήτων πρωτοτύπων δεδομένων από δειγματοληπτημένες μετρήσεις Όταν δεν μπορούν να δειγματοληφθούν δεδομένα συστήματα για συλλογή αποθήκευση και διαχείριση μεγάλων συνόλων δεδομένων μπορούν να εφαρμοστούν που κάνουν το πρόβλημα λιγότερο οξύ

Στατιστικά Θέματα Σε όλο το βιβλίο έχουμε δεί ότι η εργασία με Διαδικτυακά δεδομένα περιλαμβάνει ασυνήθεις στατιστικές δυσκολίες

Το πιο εξέχον στατιστικό θέμα στη Διαδικτυακή μέτρηση είναι το φαινόμενο της υψηλής μεταβλητότητας Υψηλή μεταβλητότητα εμφανίζεται στην κυκλοφορία (μήκη ροής και σύνδεσης) στην υποδομή (βαθμός κόμβων στους γράφους δρομολογητών και AS) και στις εφαρμογές (μεγέθη αντικειμένων Ιστού) Οι στατιστικές δυσκολίες της εργασίας με πολύ μεταβλητά δεδομένα έχουν αποκαλυφθεί σε προηγούμενα κεφάλαια περιλαμβάνουν την αστάθεια των παραδοσιακών μετρικών όπως ο εμπειρικός μέσος και η διασπορά την ανάγκη για επικέντρωση σε ουρές κατανομών για σκοπούς χαρακτηρισμού και την μετατόπιση της εστίασης σε ασυνήθη (μακρυών ουρών) πιθανοτικά μοντέλα

Ένα επιπλέον θέμα είναι η σταθερότητα Μετρημένες συνθήκες υπόκεινται σε απροσδόκητη αλλαγή κάθε στιγμή βλάβες εξοπλισμού αστραπιαίοι συνωστισμοί και δικτυακή συντήρηση όλα έχουν το δυναμικό να επηρεάσουν δραστικά τις μετρήσεις σε μια σύντομο περίοδο Αυτό κάνει τη μοντελοποίηση πιο δύσκολη στάσιμα μοντέλα μπορεί να είναι ακατάλληλα όταν μεγάλες αλλαγές στις δικτυακές συνθήκες λαμβάνουν χώρα

Έχουμε δει ότι κάποια μέτρα Διαδικτυακών ιδιοτήτων επιδεικνύουν ισχυρή μνήμη Κυρίως η κυκλοφορία δικτύου δείχνει εξάρτηση μεγάλου βεληνεκούς Αυτό κάνει τη μοντελοποίηση προκλητική απαιτώντας τη χρήση πιο εξεζητημένων μοντέλων στην περιγραφή δικτυακής κυκλοφορίας Η προσομοίωση και ο υπολογισμός απόδοσης είναι επίσης πιο δύσκολα σαν αποτέλεσμα της ισχυρής μνήμης στη δικτυακή κυκλοφορία

Αρχιτεκτονικά Θέματα Ένας αριθμός δυσκολιών στη Διαδικτυακή μέτρηση προέρχονται από ιδιότητες της αρχιτεκτονικής του Διαδικτύου

Η απλότητα πυρήνα αναφέρεται στην ιδέα ότι ενδοδικτυακά στοιχεία (δρομολογητές και μεταγωγείς) πρέπει να είναι σχετικά απλές συσκευές Έχουμε δει ότι ένας τρόπος που τέτοιες συσκευές μπορεί να απλοποιηθούν είναι να παραλειφθούν εξεζητημένες δυνατότητες μέτρησης Έτσι είναι γενικά δύσκολο να αποκτηθεί πληροφορία από δικτυακά στοιχεία σχετικά με μήκη ουρών σε δρομολογητές ή απώλεια και καθυστέρηση χωριστών πακέτων

Μια άλλη διάσταση της απλότητας πυρήνα είναι ότι επίπεδα πρωτοκόλλων πάνω από το IP συχνά δεν ιχνηλατούνται στους δρομολογητές και μεταγωγείς Έτσι για παράδειγμα μπορεί να είναι δύσκολο να παρακολουθηθεί η κυκλοφορία στο επίπεδο ροής ή σε άλλα επίπεδα υψηλότερα από αυτά των πακέτων

Η κλεψύδρα IP επίσης δημιουργεί προβλήματα κρύπτοντας πληροφορία σχετικά με επίπεδα κάτω από το IP Πακέτα μπορούν να περάσουν πάνω από ένα φάσμα διαφορετικών φυσικών μέσων με ιδιότητες που ποικίλουν ευρέως ndash για παράδειγμα ασύρματα LAN οπτική ίνα καλώδιο χαλκού και σύνδεσμοι δορυφόρου Κάποια από αυτά τα μέσα μπορεί να

811

εφαρμόζουν επαναμετάδοση ή διόρθωση εμπροσθίου σφάλματος αποκρύπτοντας τη φθορά πακέτου στο φυσικό επίπεδο Η μέτρηση στο επίπεδο πακέτου (IP) γενικά δεν περιλαμβάνει πληροφορίες σχετικά με λεπτομέρειες όπως αυτές σε χαμηλότερα επίπεδα

Τελικά το γεγονός ότι το Διαδίκτυο έχει μια αποκεντρωμένη οργάνωση σε πολλά επίπεδα σημαίνει ότι δεν υπάρχει πραγματικά κεντρική τοποθεσία στο δίκτυο για σκοπούς παρακολούθησης Για παράδειγμα υπάρχουν πολλά αυτόνομα συστήματα ανωτάτου επιπέδου στο Διαδίκτυο και ένα πακέτο μπορεί να ρεύσει μέσω οποιουδήποτε (ή κανενός) από αυτά Επιπλέον τα αυτόνομα συστήματα ανωτάτου επιπέδου γενικά συνδέονται μεταξύ τους σε πολλαπλές τοποθεσίες Αυτή η πλεγματοειδής δομή σημαίνει ότι μετρήσεις που γίνονται σε κάθε μονό σημείο αναπόφευκτα χάνουν ένα μεγάλο κλάσμα κυκλοφορίας δικτύου

Διαχειριστικά θέματα Όπως είδαμε το Διαδίκτυο είναι ένα δίκτυο δικτύων τα συστατικά δίκτυα κατέχονται και λειτουργούνται από ανεξάρτητες οντότητες ndash τους Παρόχους Υπηρεσιών Δικτύου (ISP) Πολλοί ISP είναι κερδοσκοπικές οντότητες σε ανταγωνισμό μεταξύ τους

Σαν αποτέλεσμα οι ISP αντιστέκονται στη διάθεση σημαντικής πληροφορίας εκτός του οργανισμού τους επειδή αυτή η πληροφορία μπορεί να χρησιμοποιηθεί από τον ανταγωνιστή τους Για παράδειγμα οι ISP γενικά δε δημοσιεύουν πόση κυκλοφορία μεταφέρουν τα δίκτυά τους ή το μέγεθος ή την ακριβή φυσική διάταξη των δικτύων τους ή τη σύνθεση της κυκλοφορίας τους (όπως το μίγμα εφαρμογής ή η διάδοση κακόβουλης κυκλοφορίας)

Η έλλειψη εξωτερικής πληροφορίας σχετικά με ξεχωριστά λειτουργούμενα δίκτυα εμποδίζει πολλούς αξιέπαινους σκοπούς Για παράδειγμα αυτή η μυστικότητα εξασθενεί την ικανότητά μας να ανιχνεύσουμε ξεσπάσματα λογισμικού σκουληκιού (worm) ανά το δίκτυο ή να κατανοήσουμε το ρυθμό αύξησης της δικτυακής κυκλοφορίας παγκοσμίως

113 Μελλοντική Εργασία

Οι δυσκολίες που συγκαταριθμήθηκαν στην τελευταία ενότητα παρέχουν ένα πλαίσιο για την κατανόηση του πώς η μελλοντική Διαδικτυακή μέτρηση θα περιοριστεί και προκληθεί Σε αυτήν την ενότητα ρίχνουμε μια ματιά στις τάσεις μέτρησης που μπορούν να προβλεφθούν στο μέλλον

1131 Ερευνητικές Προκλήσεις Η προσπάθεια να αυξηθεί η Διαδικτυακή κατανόησή μας οδηγεί σε έναν αριθμό

ερευνητικών προκλήσεων Αυτές αντιπροσωπεύουν ερωτήματα σχετικά με το πώς η Διαδικτυακή μέτρηση θα έπρεπε να διεξαχθεί στο μέλλον

Πλατφόρμες Μέτρησης Σε προηγούμενες ενότητες έχουμε δει ότι υπάρχουν πολλές ανικανοποίητες προκλήσεις στη μέτρηση του Διαδικτύου από την άλλη πλευρά η δραστηριότητα στη Διαδικτυακή μέτρηση έχει αυξηθεί δραματικά στα τελευταία χρόνια Αυτά τα δύο γεγονότα δείχνουν ότι φαίνεται αξιόλογο να ανατεθεί αυξημένη προσπάθεια στην κατασκευή πλατφορμών και υποδομής για Διαδικτυακή μέτρηση

Τα έργα που συζητήθηκαν στο Κεφάλαιο 10 δείχνουν ότι ένα φάσμα αρχιτεκτονικών επιλογών είναι δυνατό στην κατασκευή πλατφορμών μέτρησης [EMG] Αυτές οι επιλογές επηρεάζουν τη χρησιμότητα και την μακροπρόθεσμη επιτυχία των προσπαθειών μέτρησης που χρησιμοποιούν αυτές οι πλατφόρμες Κάποιες από τις θεωρήσεις είναι

bull Ποιος θα έπρεπε να χρηματοδοτήσει την υποδομή μέτρησης για το Διαδίκτυο Και κυβερνητικές και εμπορικές προσεγγίσεις είναι δυνατές

bull Θα έπρεπε μια υποδομή μέτρησης να ελεγχθεί από ένα μόνο οργανισμό ή θα έπρεπε ο έλεγχός του να μοιράζεται από πολλαπλούς διερευνητές ή ομάδες

911

bull Πώς θα έπρεπε να χρησιμοποιηθούν τα συστήματα μέτρησης Πώς θα έπρεπε να ληφθούν αποφάσεις αναφορικά με τη σχετική έμφαση σε διαφορετικούς σκοπούς για μια πλατφόρμα μέτρησης

bull Θα έπρεπε να κατασκευαστούν εξειδικευμένες πλατφόρμες μέτρησης ίσως για συγκεκριμένες κοινότητες χρηστών ή για την απάντηση συγκεκριμένων ζητημάτων Αν μια πλατφόρμα πρέπει να είναι γενικής χρήσης τι μορφή θα έπρεπε να πάρει

Η κατασκευή πλατφορμών μέτρησης ευρείας κλίμακας έχει το δυναμικό να κάνει πρόοδο σε θεμελιώδη ανοιχτά ερωτήματα αναφορικά με το Διαδίκτυο Για παράδειγμα η παγκόσμια τοπολογία του Διαδικτύου είναι ανεπαρκώς γνωστή και θα μπορούσε να ερευνηθεί πληρέστερα η φύση και διάδοση κακόβουλης δραστηριότητας στο Διαδίκτυο θα μπορούσε να εκτιμηθεί ακριβέστερα και ο βαθμός στον οποίο η κυκλοφορία αυξάνει και αλλάζει στο Διαδίκτυο θα μπορούσε να κατανοηθεί καλύτερα

Αποτελέσματα Διαμοιραζόμενης Μέτρησης Επίσης σημειώνουμε ότι ένω η απόκτηση Διαδικτυακών μετρήσεων μπορεί να απαιτεί σημαντική προσπάθεια σε πολλές περιπτώσεις μετρήσεις χρησιμοποιούνται μόνο για μια μόνη μελέτη η μόνο από τον οργανισμό που κάνει τις μετρήσεις

Αυτό δείχνει ότι περισσότερη εργασία θα έπρεπε να γίνει για να ξεπεραστούν οι φραγμοί στο συχνό διαμοιρασμό των μετρήσεων ή σχετιζομένων δεδομένων Αυτοί οι φραγμοί περιλαμβάνουν

bull Οι οργανισμοί μπορεί να έχουν μονοπωλιακό ενδιαφέρον σε κάποια είδη δεδομένων που ελέγχουν αλλά όχι σε άλλα Υπάρχει μια ανάγκη για μεθόδους για να γίνουν διαθέσιμες οι μετρήσεις με τρόπους που δεν απελευθερώνουν εμπορικά ευαίσθητη πληροφορία

bull Είναι συχνά μάλλον δύσκολο να τεθούν σύνολα δεδομένων μέτρησης σε μια μορφή που άλλα μπορούν να χρησιμοποιήσουν Είναι σημαντικό να κατανοηθεί και τεκμηριωθεί το πώς έγιναν οι μετρήσεις η ποιότητα των δεδομένων (συμπεριλαμβανομένης της σημείωσης του ποιά σημεία δεδομένων είναι εσφαλμένα) η μορφή των δεδομένων και οι υποθέσεις που υπόκεινται της συλλογής δεδομένων Αυτή η προσπάθεια παίρνει χρόνο

bull Η αποθήκευση και η κατανομή μεγάλων συνόλων δεδομένων μπορεί να απαιτεί σημαντκούς πόρους συμπεριλαμβανομένων του χώρου δίσκου και της χωρητικότητας δικτύου Αυτοί οι πόροι είναι ακριβοί και η χρήση τους πρέπει να δικαιολογηθεί

Η έρευνα σε αυτήν την περιοχή είναι σημαντική επειδή ο διαμοιρασμός μετρήσεων έχει πολλές ωφέλειες Σημαίνει ότι η προσπάθεια στην απόκτηση μετρήσεων ξεπληρώνεται με πολλαπλές χρήσεις Επιτρέπει τα ερευνητικά αποτελέσματα που βασίζονται στην ανάλυση των δεδομένων να επαληθευτούν ανεξάρτητα Και επιτρέπει νέα ερωτήματα να ερωτηθούν ερωτήματα που μπορεί να μην ήταν η βάση για την πρωτότυπη προσπάθεια μέτρησης

1132 Αναδυόμενα Ερωτήματα Ολοκληρώνοντας το βιβλίο είναι φυσικό να ερωτούμε ποια είναι τα επόμενα βήματα στη

Διαδικτυακή μέτρηση Πού πηγαίνει το πεδίο και ποια αναδυόμενα ερωτήματα μπορούν να προβλεφθούν Βεβαίως είναι αδύνατο να απαντηθούν πλήρως αυτές οι ερωτήσεις αλλά σε αυτήν την ενότητα προτείνουμε κάποιες μερικές απαντήσεις Χωρίζουμε τα θέματα σε βραχυπρόθεσμα και πιο μακροπρόθεσμα ερωτήματα μέτρησης

Βραχυπρόθεσμα Αυτό το βιβλίο έχει καλύψει ένα ευρύ φάσμα θεμάτων στη Διαδικτυακή μέτρηση Τα υποπεδία της υποδομής κυκλοφορίας και μέτρησης εφαρμογής είναι το καθένα σύνθετο αυτό καθαυτό Επιπλέον οι σχετιζόμενες περιοχές της ανωνυμοποίησης και ασφάλειας περιέχουν πολλά προσθέτα θέματα Παρόλα αυτά υπάρχουν περισσότερα στη

1011

Διαδικτυακή μέτρηση που μπορούν να προβλεφθούν στο κοντινό μέλλον Πολλά από αυτά τα θέματα αρχίζουν να μελετώνται αλλά δεν είναι ακόμη αναπτυγμένα ή αρκετά ώριμα για να καλυφθούν σε αυτό το βιβλίο

Η περιοχή των μετρήσεων ασυρμάτου Διαδικτύου είναι μια σημαντική αναδυόμενη περιοχή Από τη μία πλευρά η μετάδοση ασυρμάτων δεδομένων έχει χρησιμοποιηθεί στο Διαδίκτυο από τις πρώτες του μέρες ως το ARPANET Όμως στα πρώτα πειράματα του ARPANET ασύρματοι σύνδεσμοι χρησιμοποιήθηκαν για συνδέσεις δικτύου κορμού σε μακρινές τοποθεσίες συνήθως μέσω δορυφόρου Σε αντίθεση η σημασία των ασυρμάτων συνδέσμων έχει αυξηθεί δραματικά πιο πρόσφατα με την εισαγωγή της τεχνολογίας ασυρμάτων LAN Οι πιο αξιοσημείωτοι από αυτούς είναι τα πρωτόκολλα που βασίζονται στο σύνολο προτύπων IEEE 80211 (πχ WiFi)

Η φύση της ασύρματης μέτρησης είναι μάλλον διαφορετική από τη μέτρηση του ενσύρματου Διαδικτύου Η ασύρματη μέτρηση βασίζεται στη σύλληψη μετάδοσης ραδιοκυμάτων Αυτό σημαίνει ότι η ακριβής ασύρματη μέτρηση και η σωστή μετάφραση αυτών των μετρήσεων περιλαμβάνει νέα θέματα και περιορισμούς Σαν αποτέλεσμα το πεδίο της ασύρματης Διαδικτυακής μέτρησης είναι ακόμη σε υπό διαμόρφωσιν στάδια σχετικά λίγες καθοριστικές μελέτες έχουν διεξαχθεί ως τώρα

Μια άλλη αναδυόμενη περιοχή είναι τα δίκτυα αισθητήρα Αυτά είναι δίκτυα συσκευών χαμηλής ισχύος που αναμένεται να σχηματίσουν δίκτυα χωρίς σημαντική υποδομιακή υποστήριξη Υπάρχουν σημαντικά θέματα μέτρησης σχετιζόμενα με αυτά τα δίκτυα Όμως το πεδίο είναι ακόμη νεότερο από αυτό της ασυρμάτου δικτύωσης γενικά και η εργασία δεν είναι ακόμη ώριμη σε αυτήν την περιοχή

Γυρίζοντας στο ενσύρματο Διαδίκτυο ένα θέμα που δεν έχει ακόμη μελετηθεί σε βάθος είναι μετρήσεις δικτύων και κυκλοφορίας IPv6 Ενώ το πρωτόκολλο IPv6 έχει λειτουργήσει για ένα αριθμό ετών η υιοθέτηση του δεν είναι ακόμη ευρέως διαδεδομένη Σε πολλά σημεία η συμπεριφορά του IPv6 διαφέρει από το IPv4 σε μόνο λίγα σημεία αναφορικά με τις μετρήσεις έτσι δεν έχουμε εστιάσει στο IPv6 σε μεγάλο βαθμό στο βιβλίο Όμως καθώς το IPv6 γίνεται πιο ευρέως διαδεδομένο είναι πιθανό ότι νέα θέματα μέτρησης θα προκύψουν

Επιπρόσθετα όπως σημειώθηκε παραπάνω η σουίτα των εφαρμογών που χρησιμοποιούνται στο Διαδίκτυο είναι σε μια συνεχή ρευστότητα Ενώ μπορούμε να αναγνωρίσουμε γενικά μετατοπίσεις στους κυρίαρχους τύπους εφαρμογών πχ από τον Ιστό στο P2P υπάρχουν επίσης σημαντικές δευτερεύουσες μετατοπίσεις Για παράδειγμα εντός του συνόλου εφαρμογής P2P πρώιμες εφαρμογές όπως το KaZaa έχουν παραχωρήσει προτεραιότητα σε πιο πρόσφατες παραλλαγές όπως το BitTorrent Αυτές οι εφαρμογές είναι αρκετά διαφορετικές σε πολλά σημεία και αυτές οι μετατοπίσεις από μια κυρίαρχη εφαρμογή σε μια άλλη έχουν ένα σημαντικό αποτέλεσμα στη φύση της κυκλοφορίας Κοιτάζοντας στο μέλλον δικτυωμένα παιχνίδια έχουν το δυναμικό να γίνουν μια κυρίαρχη εφαρμογή (τουλάχιστον υπό όρους χρηστών αν όχι υπό όρους συνολικής κυκλοφορίας) Έχουμε προσπαθήσει να δώσουμε έμφαση στα μακροχρόνια αποτελέσματα στην περιοχή των Διαδικτυακών εφαρμογών Όμως καθώς νέες εφαρμογές αναδύονται θα υπάρξει μια φυσική μετατόπιση στην εστίαση της προσοχής μέτρησης

Τελικά έχουμε σημειώσει ότι υπάρχει σημαντικό ενδιαφέρον σε στατιστικά μοντέλα φυσικής για ιδιότητες Διαδικτύου Αυτή είναι μια περιοχή έρευνας που συχνά γεφυρώνει επιπλέον θέματα στη βιοπληροφορική κοινωνιολογία και μηχανική Δεν είχαμε το χώρο να καλύψουμε αυτό το ευρύτερο σύνολο θεμάτων Όμως έχουμε δώσει μια επισκόπηση των συνεισφορών της στατιστικής φυσικής μέχρι σήμερα στη Διαδικτυακή μοντελοποίηση και έχουμε δώσει αναφορές σε αυτήν την ερευνητική βιβλιογραφία όπου είναι σχετικό Δραστηριότητα σε αυτήν την περιοχή πιθανό να συνεχίσει και αυξηθεί στο κοντινό μέλλον

1111

Πιο Μακροπρόθεσμα Μια από τις πιο ανοικτού τέλους μελλοντικές κατευθύνσεις αφορά το τι και πώς νέα ερωτήματα θα αναδυθούν στη Διαδικτυακή μέτρηση Έχουμε δει ότι τα είδη των ερωτημάτων που διευθετήθηκαν στη Διαδικτυακή μέτρηση έχουν εξελιχθεί με το χρόνο σε πολλές περιπτώσεις η ανάδυση νέων ερωτημάτων ήταν δύσκολο να προβλεφθεί

Για παράδειγμα η έκρηξη του Παγκοσμίου Ιστού από τις αρχές ως τα μέσα της δεκαετίας του 1990 προκάλεσαν ένα τεράστιο ποσό έρευνας Από τη μια πλευρά αυτή η έρευνα ήταν κυρίως κατευθυνόμενη από τη δημοτικότητα του Ιστού ndash για παράδειγμα ένας αριθμός κατανεμημένων πληροφοριακών συστημάτων προϋπήρξε του Ιστού αλλά αυτά δεν υπόκειντο σε σημαντική προσοχή μέτρησης Από την άλλη πλευρά αυτή η έρευνα επέδειξε έναν αριθμό αποτελεσμάτων που μπορεί να θεωρηθούν θεμελιώδη όπως η παρουσία υψηλής μεταβλητότητας στα μεγέθη και τη δημοτικότητα των αντικειμένων Ιστού

Αυτό το παράδειγμα δείχνει ότι κάποια πιο μακροπρόθεσμα αναδυόμενα ερωτήματα μπορεί να κατευθυνθούν από νέες laquoεφαρμογές φονείςraquo ή από νέους τρόπους χρήσης του Διαδικτύου Αυτά είναι εξ ορισμού δύσκολο να προβλεφθούν

Ένα άλλο σύνολο πιο μακροπρόθεσμων ερωτημάτων αφορά την αυξανόμενη ενσωμάτωση του Διαδικτύου στην κοινωνία Ως τέτοια νέα ερωτήματα μέτρησης θα προκύψουν αναμφισβήτητα σε σχέση με την ανθρώπινη δραστηριότητα Για παράδειγμα καθώς η χρήση του Διαδικτύου έχει αυξηθεί στο εμπόριο υπάρχει αυξανόμενη σπουδαιότητα στην κατανόηση κακόβουλης δραστηριότητας τη μέτρηση γεωγραφικής τοποθεσίας και τη διερεύνηση της σχέσης μεταξύ της οικονομικής ανάπτυξης και της Διαδικτυακής υποδομής Αυτά τα ερωτήματα αρχίζουν να διευθετούνται μέσω εργασίας στην ασφάλεια την ανωνυμοποίηση και άλλα πεδία αλλά υπάρχουν αναμφίβολα πολλά σημαντικά ερωτήματα ακόμη να αναδυθούν

Βιβλιογραφία

Crovella M Krishnamurthy B 2006 Internet Measurement Infrastructure Traffic and Applications John Wiley amp Sons Inc 2006

ΤΕΛΟΣ ΚΑΙ Τῼ ΘΕῼ ΔΟΞΑ

  • 111 Τάσεις στη Διαδικτυακή Μέτρηση
  • 112 Δυσκολίες
  • 113 Μελλοντική Εργασία
    • 1131 Ερευνητικές Προκλήσεις
    • 1132 Αναδυόμενα Ερωτήματα
      • Βιβλιογραφία
Page 4: Μετάφραση τοῦ κεφαλαίου 11 τοῦ βιβλίου «Internet Measurement: Infrastructure, Traffic and Applications» [Translation of chapter 11 of the book «Internet

411

συχνά θεωρήθηκαν παρόμοιες σε κυκλοφορία φωνής στην πραγματικότητα ήταν πολύ λιγότερο κατανοητές

Σαν αποτέλεσμα συστήματα για υψηλής ταχύτητας σύλληψη πακέτων αναπτύχθηκαν και παρατάχθηκαν σε δικτυακά εργαστήρια Η επόμενη στατιστική ανάλυση αυτών των μαζικών συνόλων δεδομένων παρείχε τη βάση για την ανάπτυξη αυτομοίων μοντέλων κυκλοφορίας όπως περιγράφτηκε στο Κεφάλαιο 6 Τα αυτόμοια μοντέλα είναι πολύ διαφορετικά από τα μοντέλα που χρησιμοποιούνται για να περιγράψουν κυκλοφορία φωνής και η ευρεία χρήση τους αναπαριστά μια θεμελιώδη αλλαγή στον τρόπο που χαρακτηρίζεται η Διαδικτυακή κυκλοφορία

Αυτή η εξέλιξη αναπαριστά την έναρξη της λεπτομερούς ανάλυσης πολύ μεγάλων σύνολων δεδομένων σε σχέση με τη Διαδικτυακή μέτρηση Σε όλο το βιβλίο είδαμε ότι τα προβλήματα που σχετίζονταν με τη σύλληψη και ανάλυση μαζικών όγκων δεδομένων είναι τώρα μια καθημερινή μέριμνα στη Διαδικτυακή μέτρηση

Η μέτρηση και ανάλυση κυκλοφορίας υψηλής ταχύτητας επίσης αντιπροσώπευσαν τις απαρχές μιας άλλης διεισδυτικής τάσης στη Διαδικτυακή μέτρηση τη μεταχείριση του Διαδικτύου σαν αντικείμενο επιστημονικής μελέτης Η ανάπτυξη αυτομοίων μοντέλων κυκλοφορίας μεταχειρίστηκε τη δικτυακή κυκλοφορία σαν ένα άγνωστο αντικείμενο που χρειαζόταν να χαρακτηριστεί και να κατανοηθεί και οι ασυνήθεις πλευρές αυτομοιότητας πυροδότησαν ένα μεγάλο ποσό επακόλουθης μέτρησης και ανάλυσης Έτσι η ανάλυση της κυκλοφορίας υψηλής ταχύτητας διεύρυνε την εστίαση στη δικτυακή μέτρηση για να περιλάβει ερευνητικά ερωτήματα μια εστίαση που ήταν κατά μέγα μέρος απούσα από τα μέσα του 1970

Μέτρησεις Ιστού και Εφαρμογής Η έκρηξη του Παγκοσμίου Ιστού που ξεκίνησε γύρω στο 1994 ξεσήκωσε σημαντικό ενδιαφέρον στις περιοχές των φορτίων εργασίας Ιστού Από τότε που ο Ιστός γρήγορα έγινε η κυρίαρχη εφαρμογή στο Διαδίκτυο με όρους ποσότητας κυκλοφορίας οι ιδιότητες των φορτίων εργασίας Ιστού ήταν σημαντικές για την κατανόηση των αποτελεσμάτων τους στη Διαδικτυακή κυκλοφορία Επιπλέον οι μετρήσεις Ιστού χρειάζονταν να υπολογίσουν θέματα απόδοσης και να υπολογίσουν προτεινόμενες αλλαγές σχεδίου σε εξυπηρέτες Ιστού και πρωτόκολλα

Ὀπως συζητήθηκε στο Κεφάλαιο 7 οι προσπάθειες μέτρησης Ιστού ακολούθησαν ένα αριθμό διαφορετικών ωθήσεων Μια ποικιλία βελτιώσεων στο πρωτόκολλο HTTP προτάθηκαν και μετρήσεις χρειάστηκαν για να υπολογιστούν τα έξοδα και τα οφέλη αυτών των προτάσεων Η ανάπτυξη χρήσης κρυφής μνήμης Ιστού ξεσήκωσε μελέτες μετρήσεων για τον προσδιορισμό καλών αλγορίθμων αντικατάστασης κρυφής μνήμης στρατηγικών τοποθέτησης κρυφής μνήμης και σχεδιασμού χωρητικότητας κρυφής μνήμης Τελικά ο Ιστός γρήγορα έγινε η βάση για ηλεκτρονικό εμπόριο και έτσι πολλές εταιρίες είχαν ένα οικονομικό ενδιαφέρον στη μέτρηση και επαλήθευση της απόδοσης των συνδυαλλαγών Ιστού και στη διαβεβαίωση ότι κρίσιμοι εξυπηρετητές Ιστού παρέμεναν συνδεδεμένοι χειρίζονταν αιτήσεις γρήγορα και εφοδιάζονταν να χειριστούν υπερτάσεις

Η εργασία στη μέτρηση Ιστού ξεσκέπασε ένα αριθμό ενδιαφερόντων φαινομένων Αυτά περιλαμβάνουν υψηλή μεταβλητότητα σε μεγέθη αντικειμένων Ιστού την εφαρμοσιμότητα του νόμου του Zipf σε σχέση με τις αιτήσεις σε σελίδες Ιστού και τοποθεσίες Ιστού φαινόμενα αστραπιαίου συνωστισμού και τις ιδιότητες διασύνδεσης σελίδων Ιστού που επηρεάζουν την απόδοση των μηχανών αναζήτησης

Ο Ιστός ήταν το πρώτο παράδειγμα μιας εφαρμογής laquoφονιάraquo που ξεσήκωσε και παρακίνησε σημαντική δραστηριότητα μέτρησης από τη μεγάλη του δημοτικότητα Αυτό το πρότυπο έχει στη συνέχεια επαναληφθεί πχ με ομότιμες (peer-to-peer) εφαρμογές και δικτυωμένα παιχνίδια

511

Δικτυακά προσανατολισμένη Μέτρηση Κυκλοφορίας Όπως ήδη αναφέρθηκε η εργασία στη μέτρηση κυκλοφορίας τη δεκαετία του 1990 επικεντρώθηκε κυρίως σε ερωτήματα σχετικά με τον υπολογισμό της απόδοσης Αυτές οι προσπάθειες επικεντρώθηκαν σε μετρήσεις μικρής χρονικής κλίμακας (χιλιοστά του δευτερολέπτου μέχρι ώρες) και επίσης έτειναν να επικεντρωθούν σε μετρήσεις που λήφθηκαν σε ένα μόνο σημείο στο δίκτυο

Ξεκινώντας γύρω στο 2000 η προσοχή της έρευνας στη μέτρηση κυκλοφορίας διευρύνθηκε ώστε να περιλάβει ερωτήματα σχετιζόμενα πιο άμεσα με δικτυακές λειτουργίες και διαχείριση Όπως συζητήθηκε στο Κεφάλαιο 6 αυτά τα ερωτήματα αφορούσαν την κυκλοφορία σε μεγαλύτερες χρονικές κλίμακες (ώρες μέχρι μήνες) και συχνά περιλάμβανε μετρήσεις που έγιναν σε διάφορα σημεία εντός του δικτύου

Ερωτήματα δικτυακά προσανατολισμένης μέτρησης έτειναν να επικεντρωθούν σε θέματα όπως η κατανόηση ενός πίνακα δικτυακής κυκλοφορίας στο χαρακτηρισμό των ημερησίων και εβδομαδιαίων προτύπων κυκλοφοριακής παραλλαγής και στη μελέτη και πρόβλεψη του τρόπου με τον οποίο η κυκλοφορία ενός δικτύου αυξάνεται με το χρόνο Μια σχετική προσπάθεια που άρχισε περίπου τον ίδιο χρόνο επιδίωξε να αντιληφθεί τη συμπεριφορά του γενικού συστήματος δρομολόγησης όπως ελέγχεται μέσω του BGP Οι γενικές ιδιότητες της κυκλοφορίας BGP και οι ειδικοί τρόποι με τους οποίους τα γεγονότα BGP επηρεάζουν χωριστά δίκτυα άρχισαν να μελετώνται στενά

Η προσπάθεια που δαπανήθηκε σε αυτές τις κατευθύνσεις μέτρησης φαίνεται να έχει προέλθει σε μεγάλο μέρος από δικτυακούς χειριστές που αναζήτησαν μια πιο παραδεκτή βάση για δικτυακές λειτουργίες και διαχείριση Μεγάλοι εμπορικοί πάροχοι υπηρεσιών Διαδικτύου είχαν σε πολλές περιπτώσεις βασιστεί σε εξειδικευμένες προσεγγίσεις για λειτουργίες και σχεδιασμό με κάθε πάροχο να αναπτύσσει τις δικές του προσεγγίσεις μέτρησης Αυτοί οι χειριστές ήταν σε λειτουργία για ένα αριθμό ετών (συνήθως από τα τέλη της δεκαετίας του 1980 ή τις αρχές της δεκαετίας του 1990) και κάποιοι άρχισαν να αναζητούν καλύτερα εργαλεία για διαχείριση δικτύων Έτσι η τάση προς δικτυακά προσανατολισμένη μέτρηση κυκλοφορίας που προέκυψε αυτόν τον καιρό ήταν ένα φυσικό αποτέλεσμα των αναγκών δικτυακών χειριστών

Στατιστικός Συμπερασμός Καθώς το ενδιαφέρον στη Διαδικτυακή μέτρηση μεγάλωσε τα τέλη της δεκαετίας του 1990 και τις αρχές της δεκαετίας του 2000 έγινε φανερό ότι πολλά είδη χρήσιμης πληροφορίας ἠταν δύσκολο ή αδύνατο να αποκτηθούν Σε όλο το βιβλίο περιγράψαμε τους διαφόρους τρόπους με τους οποίους πληροφορία για το δίκτυο κρύπτεται από διαχειριστικά όρια επίπεδα πρωτοκόλλων και έλλειψη δυνατοτήτων μέτρησης

Αυτή η κατάσταση σχέσεων παρακίνησε το ενδιαφέρον στο στατιστικό συμπερασμό σαν ένα εργαλείο για υπολογισμό ή αντικατάσταση χαμένων ή μη διαθέσιμων δεδομένων μέτρησης Έρευνα που εφάρμοζε το συμπερασμό σε προβλήματα δικτύωσης άρχισε περί το 1996 με μεθόδους για υπολογισμό πινάκων κυκλοφορίας [Var96] και ακολουθήθηκε το 1999 από εργασία στον υπολογισμό ιδιοτήτων εσωτερικού δικτύου από μετρήσεις από άκρη σε άκρη [CDHT99] Αυτά τα αποτελέσματα παρακίνησαν ένα μεγάλο αριθμό ακόλουθης διερεύνησης και σε νέες στατιστικές μεθόδους και στην εφαρμογή μεθόδων στατιστικού συμπερασμού σε μια ευρεία ποικιλία προβλημάτων μέτρησης

Όπως περιγράφηκε στα κεφάλαια 5 και 6 η χρήση στατιστικού συμπερασμού στη Διαδικτυακή μέτρηση είναι τώρα ευρέως διαδεδομένη Αυτό μπορεί να θεωρηθεί σαν μια φυσική αντίδραση στην έλλειψη παρατηρησιμότητας που υπάρχει σε πολλές πλευρές της Διαδικτυακής αρχιτεκτονικής

Διεπιστημονικοί Σύνδεσμοι Η αύξηση του ενδιαφέροντος σε στατιστικές μεθόδους για την ανάλυση Διαδικτυακών μετρήσεων διεύρυνε την κοινότητα των ερευνητών Διαδικτυακής μέτρησης για να περιλάβει πολλούς στατιστικούς και μαθηματικούς Αρχίζοντας γύρω στο

611

2000 η κοινότητα επεκτάθηκε περισσότερο για να περιλάβει φυσικούς εργαζομένους στη στατιστική φυσική (ονομαζομένη επίσης στατιστική μηχανική)

Η στατιστική φυσική ασχολείται με τις μεγάλης κλίμακας στατιστικές ιδιότητες συλλογών πολλών αλληλεπιδρώντων συστατικών Καθώς το Διαδίκτυο έχει αυξηθεί οι Διαδικτυακές μετρήσεις έχουν γίνει πιο επιδεκτικές στα εργαλεία της στατιστικής φυσικής Πολύ από την εστίαση αυτής της εργασίας ήταν στη μελέτη και κατανόηση των ιδιοτήτων μεγάλων γράφων που προέκυψαν από Διαδικτυακές μετρήσεις (πχ ο γράφος δρομολογητών και ο γράφος AS) Το γενικό πεδίο επίσης αναφέρεται ως σύνθετα δίκτυα στη βιβλιογραφία της φυσικής και περιλαμβάνει μελέτη μεγάλων γράφων που προκύπτουν σε άλλα πεδία όπως η βιολογία και η μηχανική

Η τάση προς προσεγγίσεις στατιστικής φυσικής έχει κατευθυνθεί από μια επιθυμία για κατανόηση των γενικών ή μακροσκοπικών ιδιοτήτων του Διαδικτύου σαν συνάρτηση τοπικών ιδιοτήτων όπως επαγγελματικές αποφάσεις που λαμβάνονται από χωριστούς διαχειριστές δικτύου Αυτή η γραμμή έρευνας δεν έχει ακόμη πλήρως επιτύχει αυτό το σκοπό αλλά έχει παρακινήσει ένα ευρύ φάσμα ερωτημάτων και σημαντική τρέχουσα μελέτη Μια πρόσφατη θεώρηση των Διαδικτυακών μετρήσεων από μια οπτική στατιστικής φυσικής δίνεται στο [PSV04]

112 Δυσκολίες

Οι ευρείες τάσεις στη Διαδικτυακή μέτρηση που μόλις περιγράφηκαν έχουν κατευθυνθεί από μια ποικιλία παραγόντων Αυτές οι τάσεις προέρχονται από μια αλληλεπίδραση σκοπών μέτρησης και δυσκολιών μέτρησης

Σε αυτήν την ενότητα επιθεωρούμε τις κύριες δυσκολίες στη Διαδικτυακή μέτρηση και το πώς επηρεάζουν τάσεις στη Διαδικτυακή μέτρηση Καθένα από αυτά τα αντικέιμενα έχει απαντηθεί πολλές φορές στο βιβλίο σε ποικίλες μορφές αυτή η ενότητα εξυπηρετεί να τις συλλέξει και να τις επιθεωρήσει όλες σε ένα μέρος

Θέματα Διαδικτυακής μέτρησης μπορούν ευρέως να διαχωριστούν σε τέσσερις κατηγορίες πρακτικά θέματα στατιστικές δυσκολίες αρχιτεκτονικά θέματα και διαχειριστικά θέματα

Πρακτικά Θέματα Υπάρχει ένα ευρύ φάσμα πρακτικών προβλημάτων που εξασθενούν τη δυνατότητά μας να μετρήσουμε το Διαδίκτυο

Πρώτα ο καθαρός όγκος των δεδομένων είναι μια σημαντική πρόκληση Θέματα όγκου δεδομένων προκύπτουν σε μετρήσεις κυκλοφορίας σε μετρήσεις εφαρμογής και σε μετρήσεις υποδομής Τα μαζικά σύνολα δεδομένων που μπορούν να συλλεγούν παρουσιάζουν μια πρόκληση για αποθήκευση και επεξεργασία Σε περιπτώσεις όπως μέτρηση τοπολογίας η διαδικασία της συλλογής δεδομένων απαιτεί ένα σημαντικό ποσό χρόνου

Ένας επιδεινωτικός παράγοντας είναι ο ρυθμός αλλαγής των αντικειμένων ή ιδιοτήτων που μετρώνται Το σύστημα μπορεί να αλλάξει κατά τη διάρκεια της χρονικής περιόδου που λαμβάνονται μετρήσεις Για παράδειγμα στη μέτρηση τοπολογίας κεντρικοί υπολογιστές και σύνδεσμοι μπορούν να συνδεθούν και αποσυνδεθούν ενόσω λαμβάνει χώρα η μέτρηση Στη μέτρηση Ιστού το περιεχόμενο μπορεί να αλλάξει κατά τη διάρκεια της πορείας ενός γύρου (crawl) Στη μέτρηση P2P οι ομότιμοι μπορούν να συνδεθούν και να εξαφανιστούν κατά τη διάρκεια της μέτρησης Κατά τη διάρκεια μεγαλυτέρων περιόδων μέτρησης οι μέσοι όροι επιπέδων κυκλοφορίας θα τείνουν να αυξάνουν με το χρόνο και το μίγμα των πρωτοκόλλων και εφαρμογών που χρησιμοποιούνται στο δίκτυο θα μετατοπισθεί (όπως έχει συμβεί σε σχέση με εφαρμογές Ιστού και P2P)

711

Αυτή η σταθερή αλλαγή καθιστά δύσκολη την αναγνώριση laquoαντιπροσωπευτικώνraquo συνθηκών σε πολλές καταστάσεις Ένα συγκεκριμένο μίγμα εφαρμογής ή πρότυπο κυκλοφορίας μπορεί μόνο να είναι αντιπροσωπευτικό ορισμένων ειδών δικτύων ή σε ορισμένους χρόνους Ένα συγκεκριμένο μίγμα τύπων χρηστών ή πελατών θα έτεινε να αλλάζει με το χρόνο καθώς νέοι πελάτες συνδέονται ολόγυρα του κόσμου με διαφορετικούς βαθμούς συνδεσμικότητας

Αυτά τα πρακτικά θέματα παρουσιάζουν προκλήσεις που έχουν αντιμετωπισθεί με μια ποικιλία τρόπων Μετρήσεις εκτελούνται αυξανόμενα χρησιμοποιώντας δειγματοληψία για την ελάττωση του όγκου δεδομένων που συλλέγεται Αυτό είχε οδηγήσει σε ενδιαφέρον προς και ανάπτυξη από μεθόδους για συμπερασμό ιδιοτήτων πρωτοτύπων δεδομένων από δειγματοληπτημένες μετρήσεις Όταν δεν μπορούν να δειγματοληφθούν δεδομένα συστήματα για συλλογή αποθήκευση και διαχείριση μεγάλων συνόλων δεδομένων μπορούν να εφαρμοστούν που κάνουν το πρόβλημα λιγότερο οξύ

Στατιστικά Θέματα Σε όλο το βιβλίο έχουμε δεί ότι η εργασία με Διαδικτυακά δεδομένα περιλαμβάνει ασυνήθεις στατιστικές δυσκολίες

Το πιο εξέχον στατιστικό θέμα στη Διαδικτυακή μέτρηση είναι το φαινόμενο της υψηλής μεταβλητότητας Υψηλή μεταβλητότητα εμφανίζεται στην κυκλοφορία (μήκη ροής και σύνδεσης) στην υποδομή (βαθμός κόμβων στους γράφους δρομολογητών και AS) και στις εφαρμογές (μεγέθη αντικειμένων Ιστού) Οι στατιστικές δυσκολίες της εργασίας με πολύ μεταβλητά δεδομένα έχουν αποκαλυφθεί σε προηγούμενα κεφάλαια περιλαμβάνουν την αστάθεια των παραδοσιακών μετρικών όπως ο εμπειρικός μέσος και η διασπορά την ανάγκη για επικέντρωση σε ουρές κατανομών για σκοπούς χαρακτηρισμού και την μετατόπιση της εστίασης σε ασυνήθη (μακρυών ουρών) πιθανοτικά μοντέλα

Ένα επιπλέον θέμα είναι η σταθερότητα Μετρημένες συνθήκες υπόκεινται σε απροσδόκητη αλλαγή κάθε στιγμή βλάβες εξοπλισμού αστραπιαίοι συνωστισμοί και δικτυακή συντήρηση όλα έχουν το δυναμικό να επηρεάσουν δραστικά τις μετρήσεις σε μια σύντομο περίοδο Αυτό κάνει τη μοντελοποίηση πιο δύσκολη στάσιμα μοντέλα μπορεί να είναι ακατάλληλα όταν μεγάλες αλλαγές στις δικτυακές συνθήκες λαμβάνουν χώρα

Έχουμε δει ότι κάποια μέτρα Διαδικτυακών ιδιοτήτων επιδεικνύουν ισχυρή μνήμη Κυρίως η κυκλοφορία δικτύου δείχνει εξάρτηση μεγάλου βεληνεκούς Αυτό κάνει τη μοντελοποίηση προκλητική απαιτώντας τη χρήση πιο εξεζητημένων μοντέλων στην περιγραφή δικτυακής κυκλοφορίας Η προσομοίωση και ο υπολογισμός απόδοσης είναι επίσης πιο δύσκολα σαν αποτέλεσμα της ισχυρής μνήμης στη δικτυακή κυκλοφορία

Αρχιτεκτονικά Θέματα Ένας αριθμός δυσκολιών στη Διαδικτυακή μέτρηση προέρχονται από ιδιότητες της αρχιτεκτονικής του Διαδικτύου

Η απλότητα πυρήνα αναφέρεται στην ιδέα ότι ενδοδικτυακά στοιχεία (δρομολογητές και μεταγωγείς) πρέπει να είναι σχετικά απλές συσκευές Έχουμε δει ότι ένας τρόπος που τέτοιες συσκευές μπορεί να απλοποιηθούν είναι να παραλειφθούν εξεζητημένες δυνατότητες μέτρησης Έτσι είναι γενικά δύσκολο να αποκτηθεί πληροφορία από δικτυακά στοιχεία σχετικά με μήκη ουρών σε δρομολογητές ή απώλεια και καθυστέρηση χωριστών πακέτων

Μια άλλη διάσταση της απλότητας πυρήνα είναι ότι επίπεδα πρωτοκόλλων πάνω από το IP συχνά δεν ιχνηλατούνται στους δρομολογητές και μεταγωγείς Έτσι για παράδειγμα μπορεί να είναι δύσκολο να παρακολουθηθεί η κυκλοφορία στο επίπεδο ροής ή σε άλλα επίπεδα υψηλότερα από αυτά των πακέτων

Η κλεψύδρα IP επίσης δημιουργεί προβλήματα κρύπτοντας πληροφορία σχετικά με επίπεδα κάτω από το IP Πακέτα μπορούν να περάσουν πάνω από ένα φάσμα διαφορετικών φυσικών μέσων με ιδιότητες που ποικίλουν ευρέως ndash για παράδειγμα ασύρματα LAN οπτική ίνα καλώδιο χαλκού και σύνδεσμοι δορυφόρου Κάποια από αυτά τα μέσα μπορεί να

811

εφαρμόζουν επαναμετάδοση ή διόρθωση εμπροσθίου σφάλματος αποκρύπτοντας τη φθορά πακέτου στο φυσικό επίπεδο Η μέτρηση στο επίπεδο πακέτου (IP) γενικά δεν περιλαμβάνει πληροφορίες σχετικά με λεπτομέρειες όπως αυτές σε χαμηλότερα επίπεδα

Τελικά το γεγονός ότι το Διαδίκτυο έχει μια αποκεντρωμένη οργάνωση σε πολλά επίπεδα σημαίνει ότι δεν υπάρχει πραγματικά κεντρική τοποθεσία στο δίκτυο για σκοπούς παρακολούθησης Για παράδειγμα υπάρχουν πολλά αυτόνομα συστήματα ανωτάτου επιπέδου στο Διαδίκτυο και ένα πακέτο μπορεί να ρεύσει μέσω οποιουδήποτε (ή κανενός) από αυτά Επιπλέον τα αυτόνομα συστήματα ανωτάτου επιπέδου γενικά συνδέονται μεταξύ τους σε πολλαπλές τοποθεσίες Αυτή η πλεγματοειδής δομή σημαίνει ότι μετρήσεις που γίνονται σε κάθε μονό σημείο αναπόφευκτα χάνουν ένα μεγάλο κλάσμα κυκλοφορίας δικτύου

Διαχειριστικά θέματα Όπως είδαμε το Διαδίκτυο είναι ένα δίκτυο δικτύων τα συστατικά δίκτυα κατέχονται και λειτουργούνται από ανεξάρτητες οντότητες ndash τους Παρόχους Υπηρεσιών Δικτύου (ISP) Πολλοί ISP είναι κερδοσκοπικές οντότητες σε ανταγωνισμό μεταξύ τους

Σαν αποτέλεσμα οι ISP αντιστέκονται στη διάθεση σημαντικής πληροφορίας εκτός του οργανισμού τους επειδή αυτή η πληροφορία μπορεί να χρησιμοποιηθεί από τον ανταγωνιστή τους Για παράδειγμα οι ISP γενικά δε δημοσιεύουν πόση κυκλοφορία μεταφέρουν τα δίκτυά τους ή το μέγεθος ή την ακριβή φυσική διάταξη των δικτύων τους ή τη σύνθεση της κυκλοφορίας τους (όπως το μίγμα εφαρμογής ή η διάδοση κακόβουλης κυκλοφορίας)

Η έλλειψη εξωτερικής πληροφορίας σχετικά με ξεχωριστά λειτουργούμενα δίκτυα εμποδίζει πολλούς αξιέπαινους σκοπούς Για παράδειγμα αυτή η μυστικότητα εξασθενεί την ικανότητά μας να ανιχνεύσουμε ξεσπάσματα λογισμικού σκουληκιού (worm) ανά το δίκτυο ή να κατανοήσουμε το ρυθμό αύξησης της δικτυακής κυκλοφορίας παγκοσμίως

113 Μελλοντική Εργασία

Οι δυσκολίες που συγκαταριθμήθηκαν στην τελευταία ενότητα παρέχουν ένα πλαίσιο για την κατανόηση του πώς η μελλοντική Διαδικτυακή μέτρηση θα περιοριστεί και προκληθεί Σε αυτήν την ενότητα ρίχνουμε μια ματιά στις τάσεις μέτρησης που μπορούν να προβλεφθούν στο μέλλον

1131 Ερευνητικές Προκλήσεις Η προσπάθεια να αυξηθεί η Διαδικτυακή κατανόησή μας οδηγεί σε έναν αριθμό

ερευνητικών προκλήσεων Αυτές αντιπροσωπεύουν ερωτήματα σχετικά με το πώς η Διαδικτυακή μέτρηση θα έπρεπε να διεξαχθεί στο μέλλον

Πλατφόρμες Μέτρησης Σε προηγούμενες ενότητες έχουμε δει ότι υπάρχουν πολλές ανικανοποίητες προκλήσεις στη μέτρηση του Διαδικτύου από την άλλη πλευρά η δραστηριότητα στη Διαδικτυακή μέτρηση έχει αυξηθεί δραματικά στα τελευταία χρόνια Αυτά τα δύο γεγονότα δείχνουν ότι φαίνεται αξιόλογο να ανατεθεί αυξημένη προσπάθεια στην κατασκευή πλατφορμών και υποδομής για Διαδικτυακή μέτρηση

Τα έργα που συζητήθηκαν στο Κεφάλαιο 10 δείχνουν ότι ένα φάσμα αρχιτεκτονικών επιλογών είναι δυνατό στην κατασκευή πλατφορμών μέτρησης [EMG] Αυτές οι επιλογές επηρεάζουν τη χρησιμότητα και την μακροπρόθεσμη επιτυχία των προσπαθειών μέτρησης που χρησιμοποιούν αυτές οι πλατφόρμες Κάποιες από τις θεωρήσεις είναι

bull Ποιος θα έπρεπε να χρηματοδοτήσει την υποδομή μέτρησης για το Διαδίκτυο Και κυβερνητικές και εμπορικές προσεγγίσεις είναι δυνατές

bull Θα έπρεπε μια υποδομή μέτρησης να ελεγχθεί από ένα μόνο οργανισμό ή θα έπρεπε ο έλεγχός του να μοιράζεται από πολλαπλούς διερευνητές ή ομάδες

911

bull Πώς θα έπρεπε να χρησιμοποιηθούν τα συστήματα μέτρησης Πώς θα έπρεπε να ληφθούν αποφάσεις αναφορικά με τη σχετική έμφαση σε διαφορετικούς σκοπούς για μια πλατφόρμα μέτρησης

bull Θα έπρεπε να κατασκευαστούν εξειδικευμένες πλατφόρμες μέτρησης ίσως για συγκεκριμένες κοινότητες χρηστών ή για την απάντηση συγκεκριμένων ζητημάτων Αν μια πλατφόρμα πρέπει να είναι γενικής χρήσης τι μορφή θα έπρεπε να πάρει

Η κατασκευή πλατφορμών μέτρησης ευρείας κλίμακας έχει το δυναμικό να κάνει πρόοδο σε θεμελιώδη ανοιχτά ερωτήματα αναφορικά με το Διαδίκτυο Για παράδειγμα η παγκόσμια τοπολογία του Διαδικτύου είναι ανεπαρκώς γνωστή και θα μπορούσε να ερευνηθεί πληρέστερα η φύση και διάδοση κακόβουλης δραστηριότητας στο Διαδίκτυο θα μπορούσε να εκτιμηθεί ακριβέστερα και ο βαθμός στον οποίο η κυκλοφορία αυξάνει και αλλάζει στο Διαδίκτυο θα μπορούσε να κατανοηθεί καλύτερα

Αποτελέσματα Διαμοιραζόμενης Μέτρησης Επίσης σημειώνουμε ότι ένω η απόκτηση Διαδικτυακών μετρήσεων μπορεί να απαιτεί σημαντική προσπάθεια σε πολλές περιπτώσεις μετρήσεις χρησιμοποιούνται μόνο για μια μόνη μελέτη η μόνο από τον οργανισμό που κάνει τις μετρήσεις

Αυτό δείχνει ότι περισσότερη εργασία θα έπρεπε να γίνει για να ξεπεραστούν οι φραγμοί στο συχνό διαμοιρασμό των μετρήσεων ή σχετιζομένων δεδομένων Αυτοί οι φραγμοί περιλαμβάνουν

bull Οι οργανισμοί μπορεί να έχουν μονοπωλιακό ενδιαφέρον σε κάποια είδη δεδομένων που ελέγχουν αλλά όχι σε άλλα Υπάρχει μια ανάγκη για μεθόδους για να γίνουν διαθέσιμες οι μετρήσεις με τρόπους που δεν απελευθερώνουν εμπορικά ευαίσθητη πληροφορία

bull Είναι συχνά μάλλον δύσκολο να τεθούν σύνολα δεδομένων μέτρησης σε μια μορφή που άλλα μπορούν να χρησιμοποιήσουν Είναι σημαντικό να κατανοηθεί και τεκμηριωθεί το πώς έγιναν οι μετρήσεις η ποιότητα των δεδομένων (συμπεριλαμβανομένης της σημείωσης του ποιά σημεία δεδομένων είναι εσφαλμένα) η μορφή των δεδομένων και οι υποθέσεις που υπόκεινται της συλλογής δεδομένων Αυτή η προσπάθεια παίρνει χρόνο

bull Η αποθήκευση και η κατανομή μεγάλων συνόλων δεδομένων μπορεί να απαιτεί σημαντκούς πόρους συμπεριλαμβανομένων του χώρου δίσκου και της χωρητικότητας δικτύου Αυτοί οι πόροι είναι ακριβοί και η χρήση τους πρέπει να δικαιολογηθεί

Η έρευνα σε αυτήν την περιοχή είναι σημαντική επειδή ο διαμοιρασμός μετρήσεων έχει πολλές ωφέλειες Σημαίνει ότι η προσπάθεια στην απόκτηση μετρήσεων ξεπληρώνεται με πολλαπλές χρήσεις Επιτρέπει τα ερευνητικά αποτελέσματα που βασίζονται στην ανάλυση των δεδομένων να επαληθευτούν ανεξάρτητα Και επιτρέπει νέα ερωτήματα να ερωτηθούν ερωτήματα που μπορεί να μην ήταν η βάση για την πρωτότυπη προσπάθεια μέτρησης

1132 Αναδυόμενα Ερωτήματα Ολοκληρώνοντας το βιβλίο είναι φυσικό να ερωτούμε ποια είναι τα επόμενα βήματα στη

Διαδικτυακή μέτρηση Πού πηγαίνει το πεδίο και ποια αναδυόμενα ερωτήματα μπορούν να προβλεφθούν Βεβαίως είναι αδύνατο να απαντηθούν πλήρως αυτές οι ερωτήσεις αλλά σε αυτήν την ενότητα προτείνουμε κάποιες μερικές απαντήσεις Χωρίζουμε τα θέματα σε βραχυπρόθεσμα και πιο μακροπρόθεσμα ερωτήματα μέτρησης

Βραχυπρόθεσμα Αυτό το βιβλίο έχει καλύψει ένα ευρύ φάσμα θεμάτων στη Διαδικτυακή μέτρηση Τα υποπεδία της υποδομής κυκλοφορίας και μέτρησης εφαρμογής είναι το καθένα σύνθετο αυτό καθαυτό Επιπλέον οι σχετιζόμενες περιοχές της ανωνυμοποίησης και ασφάλειας περιέχουν πολλά προσθέτα θέματα Παρόλα αυτά υπάρχουν περισσότερα στη

1011

Διαδικτυακή μέτρηση που μπορούν να προβλεφθούν στο κοντινό μέλλον Πολλά από αυτά τα θέματα αρχίζουν να μελετώνται αλλά δεν είναι ακόμη αναπτυγμένα ή αρκετά ώριμα για να καλυφθούν σε αυτό το βιβλίο

Η περιοχή των μετρήσεων ασυρμάτου Διαδικτύου είναι μια σημαντική αναδυόμενη περιοχή Από τη μία πλευρά η μετάδοση ασυρμάτων δεδομένων έχει χρησιμοποιηθεί στο Διαδίκτυο από τις πρώτες του μέρες ως το ARPANET Όμως στα πρώτα πειράματα του ARPANET ασύρματοι σύνδεσμοι χρησιμοποιήθηκαν για συνδέσεις δικτύου κορμού σε μακρινές τοποθεσίες συνήθως μέσω δορυφόρου Σε αντίθεση η σημασία των ασυρμάτων συνδέσμων έχει αυξηθεί δραματικά πιο πρόσφατα με την εισαγωγή της τεχνολογίας ασυρμάτων LAN Οι πιο αξιοσημείωτοι από αυτούς είναι τα πρωτόκολλα που βασίζονται στο σύνολο προτύπων IEEE 80211 (πχ WiFi)

Η φύση της ασύρματης μέτρησης είναι μάλλον διαφορετική από τη μέτρηση του ενσύρματου Διαδικτύου Η ασύρματη μέτρηση βασίζεται στη σύλληψη μετάδοσης ραδιοκυμάτων Αυτό σημαίνει ότι η ακριβής ασύρματη μέτρηση και η σωστή μετάφραση αυτών των μετρήσεων περιλαμβάνει νέα θέματα και περιορισμούς Σαν αποτέλεσμα το πεδίο της ασύρματης Διαδικτυακής μέτρησης είναι ακόμη σε υπό διαμόρφωσιν στάδια σχετικά λίγες καθοριστικές μελέτες έχουν διεξαχθεί ως τώρα

Μια άλλη αναδυόμενη περιοχή είναι τα δίκτυα αισθητήρα Αυτά είναι δίκτυα συσκευών χαμηλής ισχύος που αναμένεται να σχηματίσουν δίκτυα χωρίς σημαντική υποδομιακή υποστήριξη Υπάρχουν σημαντικά θέματα μέτρησης σχετιζόμενα με αυτά τα δίκτυα Όμως το πεδίο είναι ακόμη νεότερο από αυτό της ασυρμάτου δικτύωσης γενικά και η εργασία δεν είναι ακόμη ώριμη σε αυτήν την περιοχή

Γυρίζοντας στο ενσύρματο Διαδίκτυο ένα θέμα που δεν έχει ακόμη μελετηθεί σε βάθος είναι μετρήσεις δικτύων και κυκλοφορίας IPv6 Ενώ το πρωτόκολλο IPv6 έχει λειτουργήσει για ένα αριθμό ετών η υιοθέτηση του δεν είναι ακόμη ευρέως διαδεδομένη Σε πολλά σημεία η συμπεριφορά του IPv6 διαφέρει από το IPv4 σε μόνο λίγα σημεία αναφορικά με τις μετρήσεις έτσι δεν έχουμε εστιάσει στο IPv6 σε μεγάλο βαθμό στο βιβλίο Όμως καθώς το IPv6 γίνεται πιο ευρέως διαδεδομένο είναι πιθανό ότι νέα θέματα μέτρησης θα προκύψουν

Επιπρόσθετα όπως σημειώθηκε παραπάνω η σουίτα των εφαρμογών που χρησιμοποιούνται στο Διαδίκτυο είναι σε μια συνεχή ρευστότητα Ενώ μπορούμε να αναγνωρίσουμε γενικά μετατοπίσεις στους κυρίαρχους τύπους εφαρμογών πχ από τον Ιστό στο P2P υπάρχουν επίσης σημαντικές δευτερεύουσες μετατοπίσεις Για παράδειγμα εντός του συνόλου εφαρμογής P2P πρώιμες εφαρμογές όπως το KaZaa έχουν παραχωρήσει προτεραιότητα σε πιο πρόσφατες παραλλαγές όπως το BitTorrent Αυτές οι εφαρμογές είναι αρκετά διαφορετικές σε πολλά σημεία και αυτές οι μετατοπίσεις από μια κυρίαρχη εφαρμογή σε μια άλλη έχουν ένα σημαντικό αποτέλεσμα στη φύση της κυκλοφορίας Κοιτάζοντας στο μέλλον δικτυωμένα παιχνίδια έχουν το δυναμικό να γίνουν μια κυρίαρχη εφαρμογή (τουλάχιστον υπό όρους χρηστών αν όχι υπό όρους συνολικής κυκλοφορίας) Έχουμε προσπαθήσει να δώσουμε έμφαση στα μακροχρόνια αποτελέσματα στην περιοχή των Διαδικτυακών εφαρμογών Όμως καθώς νέες εφαρμογές αναδύονται θα υπάρξει μια φυσική μετατόπιση στην εστίαση της προσοχής μέτρησης

Τελικά έχουμε σημειώσει ότι υπάρχει σημαντικό ενδιαφέρον σε στατιστικά μοντέλα φυσικής για ιδιότητες Διαδικτύου Αυτή είναι μια περιοχή έρευνας που συχνά γεφυρώνει επιπλέον θέματα στη βιοπληροφορική κοινωνιολογία και μηχανική Δεν είχαμε το χώρο να καλύψουμε αυτό το ευρύτερο σύνολο θεμάτων Όμως έχουμε δώσει μια επισκόπηση των συνεισφορών της στατιστικής φυσικής μέχρι σήμερα στη Διαδικτυακή μοντελοποίηση και έχουμε δώσει αναφορές σε αυτήν την ερευνητική βιβλιογραφία όπου είναι σχετικό Δραστηριότητα σε αυτήν την περιοχή πιθανό να συνεχίσει και αυξηθεί στο κοντινό μέλλον

1111

Πιο Μακροπρόθεσμα Μια από τις πιο ανοικτού τέλους μελλοντικές κατευθύνσεις αφορά το τι και πώς νέα ερωτήματα θα αναδυθούν στη Διαδικτυακή μέτρηση Έχουμε δει ότι τα είδη των ερωτημάτων που διευθετήθηκαν στη Διαδικτυακή μέτρηση έχουν εξελιχθεί με το χρόνο σε πολλές περιπτώσεις η ανάδυση νέων ερωτημάτων ήταν δύσκολο να προβλεφθεί

Για παράδειγμα η έκρηξη του Παγκοσμίου Ιστού από τις αρχές ως τα μέσα της δεκαετίας του 1990 προκάλεσαν ένα τεράστιο ποσό έρευνας Από τη μια πλευρά αυτή η έρευνα ήταν κυρίως κατευθυνόμενη από τη δημοτικότητα του Ιστού ndash για παράδειγμα ένας αριθμός κατανεμημένων πληροφοριακών συστημάτων προϋπήρξε του Ιστού αλλά αυτά δεν υπόκειντο σε σημαντική προσοχή μέτρησης Από την άλλη πλευρά αυτή η έρευνα επέδειξε έναν αριθμό αποτελεσμάτων που μπορεί να θεωρηθούν θεμελιώδη όπως η παρουσία υψηλής μεταβλητότητας στα μεγέθη και τη δημοτικότητα των αντικειμένων Ιστού

Αυτό το παράδειγμα δείχνει ότι κάποια πιο μακροπρόθεσμα αναδυόμενα ερωτήματα μπορεί να κατευθυνθούν από νέες laquoεφαρμογές φονείςraquo ή από νέους τρόπους χρήσης του Διαδικτύου Αυτά είναι εξ ορισμού δύσκολο να προβλεφθούν

Ένα άλλο σύνολο πιο μακροπρόθεσμων ερωτημάτων αφορά την αυξανόμενη ενσωμάτωση του Διαδικτύου στην κοινωνία Ως τέτοια νέα ερωτήματα μέτρησης θα προκύψουν αναμφισβήτητα σε σχέση με την ανθρώπινη δραστηριότητα Για παράδειγμα καθώς η χρήση του Διαδικτύου έχει αυξηθεί στο εμπόριο υπάρχει αυξανόμενη σπουδαιότητα στην κατανόηση κακόβουλης δραστηριότητας τη μέτρηση γεωγραφικής τοποθεσίας και τη διερεύνηση της σχέσης μεταξύ της οικονομικής ανάπτυξης και της Διαδικτυακής υποδομής Αυτά τα ερωτήματα αρχίζουν να διευθετούνται μέσω εργασίας στην ασφάλεια την ανωνυμοποίηση και άλλα πεδία αλλά υπάρχουν αναμφίβολα πολλά σημαντικά ερωτήματα ακόμη να αναδυθούν

Βιβλιογραφία

Crovella M Krishnamurthy B 2006 Internet Measurement Infrastructure Traffic and Applications John Wiley amp Sons Inc 2006

ΤΕΛΟΣ ΚΑΙ Τῼ ΘΕῼ ΔΟΞΑ

  • 111 Τάσεις στη Διαδικτυακή Μέτρηση
  • 112 Δυσκολίες
  • 113 Μελλοντική Εργασία
    • 1131 Ερευνητικές Προκλήσεις
    • 1132 Αναδυόμενα Ερωτήματα
      • Βιβλιογραφία
Page 5: Μετάφραση τοῦ κεφαλαίου 11 τοῦ βιβλίου «Internet Measurement: Infrastructure, Traffic and Applications» [Translation of chapter 11 of the book «Internet

511

Δικτυακά προσανατολισμένη Μέτρηση Κυκλοφορίας Όπως ήδη αναφέρθηκε η εργασία στη μέτρηση κυκλοφορίας τη δεκαετία του 1990 επικεντρώθηκε κυρίως σε ερωτήματα σχετικά με τον υπολογισμό της απόδοσης Αυτές οι προσπάθειες επικεντρώθηκαν σε μετρήσεις μικρής χρονικής κλίμακας (χιλιοστά του δευτερολέπτου μέχρι ώρες) και επίσης έτειναν να επικεντρωθούν σε μετρήσεις που λήφθηκαν σε ένα μόνο σημείο στο δίκτυο

Ξεκινώντας γύρω στο 2000 η προσοχή της έρευνας στη μέτρηση κυκλοφορίας διευρύνθηκε ώστε να περιλάβει ερωτήματα σχετιζόμενα πιο άμεσα με δικτυακές λειτουργίες και διαχείριση Όπως συζητήθηκε στο Κεφάλαιο 6 αυτά τα ερωτήματα αφορούσαν την κυκλοφορία σε μεγαλύτερες χρονικές κλίμακες (ώρες μέχρι μήνες) και συχνά περιλάμβανε μετρήσεις που έγιναν σε διάφορα σημεία εντός του δικτύου

Ερωτήματα δικτυακά προσανατολισμένης μέτρησης έτειναν να επικεντρωθούν σε θέματα όπως η κατανόηση ενός πίνακα δικτυακής κυκλοφορίας στο χαρακτηρισμό των ημερησίων και εβδομαδιαίων προτύπων κυκλοφοριακής παραλλαγής και στη μελέτη και πρόβλεψη του τρόπου με τον οποίο η κυκλοφορία ενός δικτύου αυξάνεται με το χρόνο Μια σχετική προσπάθεια που άρχισε περίπου τον ίδιο χρόνο επιδίωξε να αντιληφθεί τη συμπεριφορά του γενικού συστήματος δρομολόγησης όπως ελέγχεται μέσω του BGP Οι γενικές ιδιότητες της κυκλοφορίας BGP και οι ειδικοί τρόποι με τους οποίους τα γεγονότα BGP επηρεάζουν χωριστά δίκτυα άρχισαν να μελετώνται στενά

Η προσπάθεια που δαπανήθηκε σε αυτές τις κατευθύνσεις μέτρησης φαίνεται να έχει προέλθει σε μεγάλο μέρος από δικτυακούς χειριστές που αναζήτησαν μια πιο παραδεκτή βάση για δικτυακές λειτουργίες και διαχείριση Μεγάλοι εμπορικοί πάροχοι υπηρεσιών Διαδικτύου είχαν σε πολλές περιπτώσεις βασιστεί σε εξειδικευμένες προσεγγίσεις για λειτουργίες και σχεδιασμό με κάθε πάροχο να αναπτύσσει τις δικές του προσεγγίσεις μέτρησης Αυτοί οι χειριστές ήταν σε λειτουργία για ένα αριθμό ετών (συνήθως από τα τέλη της δεκαετίας του 1980 ή τις αρχές της δεκαετίας του 1990) και κάποιοι άρχισαν να αναζητούν καλύτερα εργαλεία για διαχείριση δικτύων Έτσι η τάση προς δικτυακά προσανατολισμένη μέτρηση κυκλοφορίας που προέκυψε αυτόν τον καιρό ήταν ένα φυσικό αποτέλεσμα των αναγκών δικτυακών χειριστών

Στατιστικός Συμπερασμός Καθώς το ενδιαφέρον στη Διαδικτυακή μέτρηση μεγάλωσε τα τέλη της δεκαετίας του 1990 και τις αρχές της δεκαετίας του 2000 έγινε φανερό ότι πολλά είδη χρήσιμης πληροφορίας ἠταν δύσκολο ή αδύνατο να αποκτηθούν Σε όλο το βιβλίο περιγράψαμε τους διαφόρους τρόπους με τους οποίους πληροφορία για το δίκτυο κρύπτεται από διαχειριστικά όρια επίπεδα πρωτοκόλλων και έλλειψη δυνατοτήτων μέτρησης

Αυτή η κατάσταση σχέσεων παρακίνησε το ενδιαφέρον στο στατιστικό συμπερασμό σαν ένα εργαλείο για υπολογισμό ή αντικατάσταση χαμένων ή μη διαθέσιμων δεδομένων μέτρησης Έρευνα που εφάρμοζε το συμπερασμό σε προβλήματα δικτύωσης άρχισε περί το 1996 με μεθόδους για υπολογισμό πινάκων κυκλοφορίας [Var96] και ακολουθήθηκε το 1999 από εργασία στον υπολογισμό ιδιοτήτων εσωτερικού δικτύου από μετρήσεις από άκρη σε άκρη [CDHT99] Αυτά τα αποτελέσματα παρακίνησαν ένα μεγάλο αριθμό ακόλουθης διερεύνησης και σε νέες στατιστικές μεθόδους και στην εφαρμογή μεθόδων στατιστικού συμπερασμού σε μια ευρεία ποικιλία προβλημάτων μέτρησης

Όπως περιγράφηκε στα κεφάλαια 5 και 6 η χρήση στατιστικού συμπερασμού στη Διαδικτυακή μέτρηση είναι τώρα ευρέως διαδεδομένη Αυτό μπορεί να θεωρηθεί σαν μια φυσική αντίδραση στην έλλειψη παρατηρησιμότητας που υπάρχει σε πολλές πλευρές της Διαδικτυακής αρχιτεκτονικής

Διεπιστημονικοί Σύνδεσμοι Η αύξηση του ενδιαφέροντος σε στατιστικές μεθόδους για την ανάλυση Διαδικτυακών μετρήσεων διεύρυνε την κοινότητα των ερευνητών Διαδικτυακής μέτρησης για να περιλάβει πολλούς στατιστικούς και μαθηματικούς Αρχίζοντας γύρω στο

611

2000 η κοινότητα επεκτάθηκε περισσότερο για να περιλάβει φυσικούς εργαζομένους στη στατιστική φυσική (ονομαζομένη επίσης στατιστική μηχανική)

Η στατιστική φυσική ασχολείται με τις μεγάλης κλίμακας στατιστικές ιδιότητες συλλογών πολλών αλληλεπιδρώντων συστατικών Καθώς το Διαδίκτυο έχει αυξηθεί οι Διαδικτυακές μετρήσεις έχουν γίνει πιο επιδεκτικές στα εργαλεία της στατιστικής φυσικής Πολύ από την εστίαση αυτής της εργασίας ήταν στη μελέτη και κατανόηση των ιδιοτήτων μεγάλων γράφων που προέκυψαν από Διαδικτυακές μετρήσεις (πχ ο γράφος δρομολογητών και ο γράφος AS) Το γενικό πεδίο επίσης αναφέρεται ως σύνθετα δίκτυα στη βιβλιογραφία της φυσικής και περιλαμβάνει μελέτη μεγάλων γράφων που προκύπτουν σε άλλα πεδία όπως η βιολογία και η μηχανική

Η τάση προς προσεγγίσεις στατιστικής φυσικής έχει κατευθυνθεί από μια επιθυμία για κατανόηση των γενικών ή μακροσκοπικών ιδιοτήτων του Διαδικτύου σαν συνάρτηση τοπικών ιδιοτήτων όπως επαγγελματικές αποφάσεις που λαμβάνονται από χωριστούς διαχειριστές δικτύου Αυτή η γραμμή έρευνας δεν έχει ακόμη πλήρως επιτύχει αυτό το σκοπό αλλά έχει παρακινήσει ένα ευρύ φάσμα ερωτημάτων και σημαντική τρέχουσα μελέτη Μια πρόσφατη θεώρηση των Διαδικτυακών μετρήσεων από μια οπτική στατιστικής φυσικής δίνεται στο [PSV04]

112 Δυσκολίες

Οι ευρείες τάσεις στη Διαδικτυακή μέτρηση που μόλις περιγράφηκαν έχουν κατευθυνθεί από μια ποικιλία παραγόντων Αυτές οι τάσεις προέρχονται από μια αλληλεπίδραση σκοπών μέτρησης και δυσκολιών μέτρησης

Σε αυτήν την ενότητα επιθεωρούμε τις κύριες δυσκολίες στη Διαδικτυακή μέτρηση και το πώς επηρεάζουν τάσεις στη Διαδικτυακή μέτρηση Καθένα από αυτά τα αντικέιμενα έχει απαντηθεί πολλές φορές στο βιβλίο σε ποικίλες μορφές αυτή η ενότητα εξυπηρετεί να τις συλλέξει και να τις επιθεωρήσει όλες σε ένα μέρος

Θέματα Διαδικτυακής μέτρησης μπορούν ευρέως να διαχωριστούν σε τέσσερις κατηγορίες πρακτικά θέματα στατιστικές δυσκολίες αρχιτεκτονικά θέματα και διαχειριστικά θέματα

Πρακτικά Θέματα Υπάρχει ένα ευρύ φάσμα πρακτικών προβλημάτων που εξασθενούν τη δυνατότητά μας να μετρήσουμε το Διαδίκτυο

Πρώτα ο καθαρός όγκος των δεδομένων είναι μια σημαντική πρόκληση Θέματα όγκου δεδομένων προκύπτουν σε μετρήσεις κυκλοφορίας σε μετρήσεις εφαρμογής και σε μετρήσεις υποδομής Τα μαζικά σύνολα δεδομένων που μπορούν να συλλεγούν παρουσιάζουν μια πρόκληση για αποθήκευση και επεξεργασία Σε περιπτώσεις όπως μέτρηση τοπολογίας η διαδικασία της συλλογής δεδομένων απαιτεί ένα σημαντικό ποσό χρόνου

Ένας επιδεινωτικός παράγοντας είναι ο ρυθμός αλλαγής των αντικειμένων ή ιδιοτήτων που μετρώνται Το σύστημα μπορεί να αλλάξει κατά τη διάρκεια της χρονικής περιόδου που λαμβάνονται μετρήσεις Για παράδειγμα στη μέτρηση τοπολογίας κεντρικοί υπολογιστές και σύνδεσμοι μπορούν να συνδεθούν και αποσυνδεθούν ενόσω λαμβάνει χώρα η μέτρηση Στη μέτρηση Ιστού το περιεχόμενο μπορεί να αλλάξει κατά τη διάρκεια της πορείας ενός γύρου (crawl) Στη μέτρηση P2P οι ομότιμοι μπορούν να συνδεθούν και να εξαφανιστούν κατά τη διάρκεια της μέτρησης Κατά τη διάρκεια μεγαλυτέρων περιόδων μέτρησης οι μέσοι όροι επιπέδων κυκλοφορίας θα τείνουν να αυξάνουν με το χρόνο και το μίγμα των πρωτοκόλλων και εφαρμογών που χρησιμοποιούνται στο δίκτυο θα μετατοπισθεί (όπως έχει συμβεί σε σχέση με εφαρμογές Ιστού και P2P)

711

Αυτή η σταθερή αλλαγή καθιστά δύσκολη την αναγνώριση laquoαντιπροσωπευτικώνraquo συνθηκών σε πολλές καταστάσεις Ένα συγκεκριμένο μίγμα εφαρμογής ή πρότυπο κυκλοφορίας μπορεί μόνο να είναι αντιπροσωπευτικό ορισμένων ειδών δικτύων ή σε ορισμένους χρόνους Ένα συγκεκριμένο μίγμα τύπων χρηστών ή πελατών θα έτεινε να αλλάζει με το χρόνο καθώς νέοι πελάτες συνδέονται ολόγυρα του κόσμου με διαφορετικούς βαθμούς συνδεσμικότητας

Αυτά τα πρακτικά θέματα παρουσιάζουν προκλήσεις που έχουν αντιμετωπισθεί με μια ποικιλία τρόπων Μετρήσεις εκτελούνται αυξανόμενα χρησιμοποιώντας δειγματοληψία για την ελάττωση του όγκου δεδομένων που συλλέγεται Αυτό είχε οδηγήσει σε ενδιαφέρον προς και ανάπτυξη από μεθόδους για συμπερασμό ιδιοτήτων πρωτοτύπων δεδομένων από δειγματοληπτημένες μετρήσεις Όταν δεν μπορούν να δειγματοληφθούν δεδομένα συστήματα για συλλογή αποθήκευση και διαχείριση μεγάλων συνόλων δεδομένων μπορούν να εφαρμοστούν που κάνουν το πρόβλημα λιγότερο οξύ

Στατιστικά Θέματα Σε όλο το βιβλίο έχουμε δεί ότι η εργασία με Διαδικτυακά δεδομένα περιλαμβάνει ασυνήθεις στατιστικές δυσκολίες

Το πιο εξέχον στατιστικό θέμα στη Διαδικτυακή μέτρηση είναι το φαινόμενο της υψηλής μεταβλητότητας Υψηλή μεταβλητότητα εμφανίζεται στην κυκλοφορία (μήκη ροής και σύνδεσης) στην υποδομή (βαθμός κόμβων στους γράφους δρομολογητών και AS) και στις εφαρμογές (μεγέθη αντικειμένων Ιστού) Οι στατιστικές δυσκολίες της εργασίας με πολύ μεταβλητά δεδομένα έχουν αποκαλυφθεί σε προηγούμενα κεφάλαια περιλαμβάνουν την αστάθεια των παραδοσιακών μετρικών όπως ο εμπειρικός μέσος και η διασπορά την ανάγκη για επικέντρωση σε ουρές κατανομών για σκοπούς χαρακτηρισμού και την μετατόπιση της εστίασης σε ασυνήθη (μακρυών ουρών) πιθανοτικά μοντέλα

Ένα επιπλέον θέμα είναι η σταθερότητα Μετρημένες συνθήκες υπόκεινται σε απροσδόκητη αλλαγή κάθε στιγμή βλάβες εξοπλισμού αστραπιαίοι συνωστισμοί και δικτυακή συντήρηση όλα έχουν το δυναμικό να επηρεάσουν δραστικά τις μετρήσεις σε μια σύντομο περίοδο Αυτό κάνει τη μοντελοποίηση πιο δύσκολη στάσιμα μοντέλα μπορεί να είναι ακατάλληλα όταν μεγάλες αλλαγές στις δικτυακές συνθήκες λαμβάνουν χώρα

Έχουμε δει ότι κάποια μέτρα Διαδικτυακών ιδιοτήτων επιδεικνύουν ισχυρή μνήμη Κυρίως η κυκλοφορία δικτύου δείχνει εξάρτηση μεγάλου βεληνεκούς Αυτό κάνει τη μοντελοποίηση προκλητική απαιτώντας τη χρήση πιο εξεζητημένων μοντέλων στην περιγραφή δικτυακής κυκλοφορίας Η προσομοίωση και ο υπολογισμός απόδοσης είναι επίσης πιο δύσκολα σαν αποτέλεσμα της ισχυρής μνήμης στη δικτυακή κυκλοφορία

Αρχιτεκτονικά Θέματα Ένας αριθμός δυσκολιών στη Διαδικτυακή μέτρηση προέρχονται από ιδιότητες της αρχιτεκτονικής του Διαδικτύου

Η απλότητα πυρήνα αναφέρεται στην ιδέα ότι ενδοδικτυακά στοιχεία (δρομολογητές και μεταγωγείς) πρέπει να είναι σχετικά απλές συσκευές Έχουμε δει ότι ένας τρόπος που τέτοιες συσκευές μπορεί να απλοποιηθούν είναι να παραλειφθούν εξεζητημένες δυνατότητες μέτρησης Έτσι είναι γενικά δύσκολο να αποκτηθεί πληροφορία από δικτυακά στοιχεία σχετικά με μήκη ουρών σε δρομολογητές ή απώλεια και καθυστέρηση χωριστών πακέτων

Μια άλλη διάσταση της απλότητας πυρήνα είναι ότι επίπεδα πρωτοκόλλων πάνω από το IP συχνά δεν ιχνηλατούνται στους δρομολογητές και μεταγωγείς Έτσι για παράδειγμα μπορεί να είναι δύσκολο να παρακολουθηθεί η κυκλοφορία στο επίπεδο ροής ή σε άλλα επίπεδα υψηλότερα από αυτά των πακέτων

Η κλεψύδρα IP επίσης δημιουργεί προβλήματα κρύπτοντας πληροφορία σχετικά με επίπεδα κάτω από το IP Πακέτα μπορούν να περάσουν πάνω από ένα φάσμα διαφορετικών φυσικών μέσων με ιδιότητες που ποικίλουν ευρέως ndash για παράδειγμα ασύρματα LAN οπτική ίνα καλώδιο χαλκού και σύνδεσμοι δορυφόρου Κάποια από αυτά τα μέσα μπορεί να

811

εφαρμόζουν επαναμετάδοση ή διόρθωση εμπροσθίου σφάλματος αποκρύπτοντας τη φθορά πακέτου στο φυσικό επίπεδο Η μέτρηση στο επίπεδο πακέτου (IP) γενικά δεν περιλαμβάνει πληροφορίες σχετικά με λεπτομέρειες όπως αυτές σε χαμηλότερα επίπεδα

Τελικά το γεγονός ότι το Διαδίκτυο έχει μια αποκεντρωμένη οργάνωση σε πολλά επίπεδα σημαίνει ότι δεν υπάρχει πραγματικά κεντρική τοποθεσία στο δίκτυο για σκοπούς παρακολούθησης Για παράδειγμα υπάρχουν πολλά αυτόνομα συστήματα ανωτάτου επιπέδου στο Διαδίκτυο και ένα πακέτο μπορεί να ρεύσει μέσω οποιουδήποτε (ή κανενός) από αυτά Επιπλέον τα αυτόνομα συστήματα ανωτάτου επιπέδου γενικά συνδέονται μεταξύ τους σε πολλαπλές τοποθεσίες Αυτή η πλεγματοειδής δομή σημαίνει ότι μετρήσεις που γίνονται σε κάθε μονό σημείο αναπόφευκτα χάνουν ένα μεγάλο κλάσμα κυκλοφορίας δικτύου

Διαχειριστικά θέματα Όπως είδαμε το Διαδίκτυο είναι ένα δίκτυο δικτύων τα συστατικά δίκτυα κατέχονται και λειτουργούνται από ανεξάρτητες οντότητες ndash τους Παρόχους Υπηρεσιών Δικτύου (ISP) Πολλοί ISP είναι κερδοσκοπικές οντότητες σε ανταγωνισμό μεταξύ τους

Σαν αποτέλεσμα οι ISP αντιστέκονται στη διάθεση σημαντικής πληροφορίας εκτός του οργανισμού τους επειδή αυτή η πληροφορία μπορεί να χρησιμοποιηθεί από τον ανταγωνιστή τους Για παράδειγμα οι ISP γενικά δε δημοσιεύουν πόση κυκλοφορία μεταφέρουν τα δίκτυά τους ή το μέγεθος ή την ακριβή φυσική διάταξη των δικτύων τους ή τη σύνθεση της κυκλοφορίας τους (όπως το μίγμα εφαρμογής ή η διάδοση κακόβουλης κυκλοφορίας)

Η έλλειψη εξωτερικής πληροφορίας σχετικά με ξεχωριστά λειτουργούμενα δίκτυα εμποδίζει πολλούς αξιέπαινους σκοπούς Για παράδειγμα αυτή η μυστικότητα εξασθενεί την ικανότητά μας να ανιχνεύσουμε ξεσπάσματα λογισμικού σκουληκιού (worm) ανά το δίκτυο ή να κατανοήσουμε το ρυθμό αύξησης της δικτυακής κυκλοφορίας παγκοσμίως

113 Μελλοντική Εργασία

Οι δυσκολίες που συγκαταριθμήθηκαν στην τελευταία ενότητα παρέχουν ένα πλαίσιο για την κατανόηση του πώς η μελλοντική Διαδικτυακή μέτρηση θα περιοριστεί και προκληθεί Σε αυτήν την ενότητα ρίχνουμε μια ματιά στις τάσεις μέτρησης που μπορούν να προβλεφθούν στο μέλλον

1131 Ερευνητικές Προκλήσεις Η προσπάθεια να αυξηθεί η Διαδικτυακή κατανόησή μας οδηγεί σε έναν αριθμό

ερευνητικών προκλήσεων Αυτές αντιπροσωπεύουν ερωτήματα σχετικά με το πώς η Διαδικτυακή μέτρηση θα έπρεπε να διεξαχθεί στο μέλλον

Πλατφόρμες Μέτρησης Σε προηγούμενες ενότητες έχουμε δει ότι υπάρχουν πολλές ανικανοποίητες προκλήσεις στη μέτρηση του Διαδικτύου από την άλλη πλευρά η δραστηριότητα στη Διαδικτυακή μέτρηση έχει αυξηθεί δραματικά στα τελευταία χρόνια Αυτά τα δύο γεγονότα δείχνουν ότι φαίνεται αξιόλογο να ανατεθεί αυξημένη προσπάθεια στην κατασκευή πλατφορμών και υποδομής για Διαδικτυακή μέτρηση

Τα έργα που συζητήθηκαν στο Κεφάλαιο 10 δείχνουν ότι ένα φάσμα αρχιτεκτονικών επιλογών είναι δυνατό στην κατασκευή πλατφορμών μέτρησης [EMG] Αυτές οι επιλογές επηρεάζουν τη χρησιμότητα και την μακροπρόθεσμη επιτυχία των προσπαθειών μέτρησης που χρησιμοποιούν αυτές οι πλατφόρμες Κάποιες από τις θεωρήσεις είναι

bull Ποιος θα έπρεπε να χρηματοδοτήσει την υποδομή μέτρησης για το Διαδίκτυο Και κυβερνητικές και εμπορικές προσεγγίσεις είναι δυνατές

bull Θα έπρεπε μια υποδομή μέτρησης να ελεγχθεί από ένα μόνο οργανισμό ή θα έπρεπε ο έλεγχός του να μοιράζεται από πολλαπλούς διερευνητές ή ομάδες

911

bull Πώς θα έπρεπε να χρησιμοποιηθούν τα συστήματα μέτρησης Πώς θα έπρεπε να ληφθούν αποφάσεις αναφορικά με τη σχετική έμφαση σε διαφορετικούς σκοπούς για μια πλατφόρμα μέτρησης

bull Θα έπρεπε να κατασκευαστούν εξειδικευμένες πλατφόρμες μέτρησης ίσως για συγκεκριμένες κοινότητες χρηστών ή για την απάντηση συγκεκριμένων ζητημάτων Αν μια πλατφόρμα πρέπει να είναι γενικής χρήσης τι μορφή θα έπρεπε να πάρει

Η κατασκευή πλατφορμών μέτρησης ευρείας κλίμακας έχει το δυναμικό να κάνει πρόοδο σε θεμελιώδη ανοιχτά ερωτήματα αναφορικά με το Διαδίκτυο Για παράδειγμα η παγκόσμια τοπολογία του Διαδικτύου είναι ανεπαρκώς γνωστή και θα μπορούσε να ερευνηθεί πληρέστερα η φύση και διάδοση κακόβουλης δραστηριότητας στο Διαδίκτυο θα μπορούσε να εκτιμηθεί ακριβέστερα και ο βαθμός στον οποίο η κυκλοφορία αυξάνει και αλλάζει στο Διαδίκτυο θα μπορούσε να κατανοηθεί καλύτερα

Αποτελέσματα Διαμοιραζόμενης Μέτρησης Επίσης σημειώνουμε ότι ένω η απόκτηση Διαδικτυακών μετρήσεων μπορεί να απαιτεί σημαντική προσπάθεια σε πολλές περιπτώσεις μετρήσεις χρησιμοποιούνται μόνο για μια μόνη μελέτη η μόνο από τον οργανισμό που κάνει τις μετρήσεις

Αυτό δείχνει ότι περισσότερη εργασία θα έπρεπε να γίνει για να ξεπεραστούν οι φραγμοί στο συχνό διαμοιρασμό των μετρήσεων ή σχετιζομένων δεδομένων Αυτοί οι φραγμοί περιλαμβάνουν

bull Οι οργανισμοί μπορεί να έχουν μονοπωλιακό ενδιαφέρον σε κάποια είδη δεδομένων που ελέγχουν αλλά όχι σε άλλα Υπάρχει μια ανάγκη για μεθόδους για να γίνουν διαθέσιμες οι μετρήσεις με τρόπους που δεν απελευθερώνουν εμπορικά ευαίσθητη πληροφορία

bull Είναι συχνά μάλλον δύσκολο να τεθούν σύνολα δεδομένων μέτρησης σε μια μορφή που άλλα μπορούν να χρησιμοποιήσουν Είναι σημαντικό να κατανοηθεί και τεκμηριωθεί το πώς έγιναν οι μετρήσεις η ποιότητα των δεδομένων (συμπεριλαμβανομένης της σημείωσης του ποιά σημεία δεδομένων είναι εσφαλμένα) η μορφή των δεδομένων και οι υποθέσεις που υπόκεινται της συλλογής δεδομένων Αυτή η προσπάθεια παίρνει χρόνο

bull Η αποθήκευση και η κατανομή μεγάλων συνόλων δεδομένων μπορεί να απαιτεί σημαντκούς πόρους συμπεριλαμβανομένων του χώρου δίσκου και της χωρητικότητας δικτύου Αυτοί οι πόροι είναι ακριβοί και η χρήση τους πρέπει να δικαιολογηθεί

Η έρευνα σε αυτήν την περιοχή είναι σημαντική επειδή ο διαμοιρασμός μετρήσεων έχει πολλές ωφέλειες Σημαίνει ότι η προσπάθεια στην απόκτηση μετρήσεων ξεπληρώνεται με πολλαπλές χρήσεις Επιτρέπει τα ερευνητικά αποτελέσματα που βασίζονται στην ανάλυση των δεδομένων να επαληθευτούν ανεξάρτητα Και επιτρέπει νέα ερωτήματα να ερωτηθούν ερωτήματα που μπορεί να μην ήταν η βάση για την πρωτότυπη προσπάθεια μέτρησης

1132 Αναδυόμενα Ερωτήματα Ολοκληρώνοντας το βιβλίο είναι φυσικό να ερωτούμε ποια είναι τα επόμενα βήματα στη

Διαδικτυακή μέτρηση Πού πηγαίνει το πεδίο και ποια αναδυόμενα ερωτήματα μπορούν να προβλεφθούν Βεβαίως είναι αδύνατο να απαντηθούν πλήρως αυτές οι ερωτήσεις αλλά σε αυτήν την ενότητα προτείνουμε κάποιες μερικές απαντήσεις Χωρίζουμε τα θέματα σε βραχυπρόθεσμα και πιο μακροπρόθεσμα ερωτήματα μέτρησης

Βραχυπρόθεσμα Αυτό το βιβλίο έχει καλύψει ένα ευρύ φάσμα θεμάτων στη Διαδικτυακή μέτρηση Τα υποπεδία της υποδομής κυκλοφορίας και μέτρησης εφαρμογής είναι το καθένα σύνθετο αυτό καθαυτό Επιπλέον οι σχετιζόμενες περιοχές της ανωνυμοποίησης και ασφάλειας περιέχουν πολλά προσθέτα θέματα Παρόλα αυτά υπάρχουν περισσότερα στη

1011

Διαδικτυακή μέτρηση που μπορούν να προβλεφθούν στο κοντινό μέλλον Πολλά από αυτά τα θέματα αρχίζουν να μελετώνται αλλά δεν είναι ακόμη αναπτυγμένα ή αρκετά ώριμα για να καλυφθούν σε αυτό το βιβλίο

Η περιοχή των μετρήσεων ασυρμάτου Διαδικτύου είναι μια σημαντική αναδυόμενη περιοχή Από τη μία πλευρά η μετάδοση ασυρμάτων δεδομένων έχει χρησιμοποιηθεί στο Διαδίκτυο από τις πρώτες του μέρες ως το ARPANET Όμως στα πρώτα πειράματα του ARPANET ασύρματοι σύνδεσμοι χρησιμοποιήθηκαν για συνδέσεις δικτύου κορμού σε μακρινές τοποθεσίες συνήθως μέσω δορυφόρου Σε αντίθεση η σημασία των ασυρμάτων συνδέσμων έχει αυξηθεί δραματικά πιο πρόσφατα με την εισαγωγή της τεχνολογίας ασυρμάτων LAN Οι πιο αξιοσημείωτοι από αυτούς είναι τα πρωτόκολλα που βασίζονται στο σύνολο προτύπων IEEE 80211 (πχ WiFi)

Η φύση της ασύρματης μέτρησης είναι μάλλον διαφορετική από τη μέτρηση του ενσύρματου Διαδικτύου Η ασύρματη μέτρηση βασίζεται στη σύλληψη μετάδοσης ραδιοκυμάτων Αυτό σημαίνει ότι η ακριβής ασύρματη μέτρηση και η σωστή μετάφραση αυτών των μετρήσεων περιλαμβάνει νέα θέματα και περιορισμούς Σαν αποτέλεσμα το πεδίο της ασύρματης Διαδικτυακής μέτρησης είναι ακόμη σε υπό διαμόρφωσιν στάδια σχετικά λίγες καθοριστικές μελέτες έχουν διεξαχθεί ως τώρα

Μια άλλη αναδυόμενη περιοχή είναι τα δίκτυα αισθητήρα Αυτά είναι δίκτυα συσκευών χαμηλής ισχύος που αναμένεται να σχηματίσουν δίκτυα χωρίς σημαντική υποδομιακή υποστήριξη Υπάρχουν σημαντικά θέματα μέτρησης σχετιζόμενα με αυτά τα δίκτυα Όμως το πεδίο είναι ακόμη νεότερο από αυτό της ασυρμάτου δικτύωσης γενικά και η εργασία δεν είναι ακόμη ώριμη σε αυτήν την περιοχή

Γυρίζοντας στο ενσύρματο Διαδίκτυο ένα θέμα που δεν έχει ακόμη μελετηθεί σε βάθος είναι μετρήσεις δικτύων και κυκλοφορίας IPv6 Ενώ το πρωτόκολλο IPv6 έχει λειτουργήσει για ένα αριθμό ετών η υιοθέτηση του δεν είναι ακόμη ευρέως διαδεδομένη Σε πολλά σημεία η συμπεριφορά του IPv6 διαφέρει από το IPv4 σε μόνο λίγα σημεία αναφορικά με τις μετρήσεις έτσι δεν έχουμε εστιάσει στο IPv6 σε μεγάλο βαθμό στο βιβλίο Όμως καθώς το IPv6 γίνεται πιο ευρέως διαδεδομένο είναι πιθανό ότι νέα θέματα μέτρησης θα προκύψουν

Επιπρόσθετα όπως σημειώθηκε παραπάνω η σουίτα των εφαρμογών που χρησιμοποιούνται στο Διαδίκτυο είναι σε μια συνεχή ρευστότητα Ενώ μπορούμε να αναγνωρίσουμε γενικά μετατοπίσεις στους κυρίαρχους τύπους εφαρμογών πχ από τον Ιστό στο P2P υπάρχουν επίσης σημαντικές δευτερεύουσες μετατοπίσεις Για παράδειγμα εντός του συνόλου εφαρμογής P2P πρώιμες εφαρμογές όπως το KaZaa έχουν παραχωρήσει προτεραιότητα σε πιο πρόσφατες παραλλαγές όπως το BitTorrent Αυτές οι εφαρμογές είναι αρκετά διαφορετικές σε πολλά σημεία και αυτές οι μετατοπίσεις από μια κυρίαρχη εφαρμογή σε μια άλλη έχουν ένα σημαντικό αποτέλεσμα στη φύση της κυκλοφορίας Κοιτάζοντας στο μέλλον δικτυωμένα παιχνίδια έχουν το δυναμικό να γίνουν μια κυρίαρχη εφαρμογή (τουλάχιστον υπό όρους χρηστών αν όχι υπό όρους συνολικής κυκλοφορίας) Έχουμε προσπαθήσει να δώσουμε έμφαση στα μακροχρόνια αποτελέσματα στην περιοχή των Διαδικτυακών εφαρμογών Όμως καθώς νέες εφαρμογές αναδύονται θα υπάρξει μια φυσική μετατόπιση στην εστίαση της προσοχής μέτρησης

Τελικά έχουμε σημειώσει ότι υπάρχει σημαντικό ενδιαφέρον σε στατιστικά μοντέλα φυσικής για ιδιότητες Διαδικτύου Αυτή είναι μια περιοχή έρευνας που συχνά γεφυρώνει επιπλέον θέματα στη βιοπληροφορική κοινωνιολογία και μηχανική Δεν είχαμε το χώρο να καλύψουμε αυτό το ευρύτερο σύνολο θεμάτων Όμως έχουμε δώσει μια επισκόπηση των συνεισφορών της στατιστικής φυσικής μέχρι σήμερα στη Διαδικτυακή μοντελοποίηση και έχουμε δώσει αναφορές σε αυτήν την ερευνητική βιβλιογραφία όπου είναι σχετικό Δραστηριότητα σε αυτήν την περιοχή πιθανό να συνεχίσει και αυξηθεί στο κοντινό μέλλον

1111

Πιο Μακροπρόθεσμα Μια από τις πιο ανοικτού τέλους μελλοντικές κατευθύνσεις αφορά το τι και πώς νέα ερωτήματα θα αναδυθούν στη Διαδικτυακή μέτρηση Έχουμε δει ότι τα είδη των ερωτημάτων που διευθετήθηκαν στη Διαδικτυακή μέτρηση έχουν εξελιχθεί με το χρόνο σε πολλές περιπτώσεις η ανάδυση νέων ερωτημάτων ήταν δύσκολο να προβλεφθεί

Για παράδειγμα η έκρηξη του Παγκοσμίου Ιστού από τις αρχές ως τα μέσα της δεκαετίας του 1990 προκάλεσαν ένα τεράστιο ποσό έρευνας Από τη μια πλευρά αυτή η έρευνα ήταν κυρίως κατευθυνόμενη από τη δημοτικότητα του Ιστού ndash για παράδειγμα ένας αριθμός κατανεμημένων πληροφοριακών συστημάτων προϋπήρξε του Ιστού αλλά αυτά δεν υπόκειντο σε σημαντική προσοχή μέτρησης Από την άλλη πλευρά αυτή η έρευνα επέδειξε έναν αριθμό αποτελεσμάτων που μπορεί να θεωρηθούν θεμελιώδη όπως η παρουσία υψηλής μεταβλητότητας στα μεγέθη και τη δημοτικότητα των αντικειμένων Ιστού

Αυτό το παράδειγμα δείχνει ότι κάποια πιο μακροπρόθεσμα αναδυόμενα ερωτήματα μπορεί να κατευθυνθούν από νέες laquoεφαρμογές φονείςraquo ή από νέους τρόπους χρήσης του Διαδικτύου Αυτά είναι εξ ορισμού δύσκολο να προβλεφθούν

Ένα άλλο σύνολο πιο μακροπρόθεσμων ερωτημάτων αφορά την αυξανόμενη ενσωμάτωση του Διαδικτύου στην κοινωνία Ως τέτοια νέα ερωτήματα μέτρησης θα προκύψουν αναμφισβήτητα σε σχέση με την ανθρώπινη δραστηριότητα Για παράδειγμα καθώς η χρήση του Διαδικτύου έχει αυξηθεί στο εμπόριο υπάρχει αυξανόμενη σπουδαιότητα στην κατανόηση κακόβουλης δραστηριότητας τη μέτρηση γεωγραφικής τοποθεσίας και τη διερεύνηση της σχέσης μεταξύ της οικονομικής ανάπτυξης και της Διαδικτυακής υποδομής Αυτά τα ερωτήματα αρχίζουν να διευθετούνται μέσω εργασίας στην ασφάλεια την ανωνυμοποίηση και άλλα πεδία αλλά υπάρχουν αναμφίβολα πολλά σημαντικά ερωτήματα ακόμη να αναδυθούν

Βιβλιογραφία

Crovella M Krishnamurthy B 2006 Internet Measurement Infrastructure Traffic and Applications John Wiley amp Sons Inc 2006

ΤΕΛΟΣ ΚΑΙ Τῼ ΘΕῼ ΔΟΞΑ

  • 111 Τάσεις στη Διαδικτυακή Μέτρηση
  • 112 Δυσκολίες
  • 113 Μελλοντική Εργασία
    • 1131 Ερευνητικές Προκλήσεις
    • 1132 Αναδυόμενα Ερωτήματα
      • Βιβλιογραφία
Page 6: Μετάφραση τοῦ κεφαλαίου 11 τοῦ βιβλίου «Internet Measurement: Infrastructure, Traffic and Applications» [Translation of chapter 11 of the book «Internet

611

2000 η κοινότητα επεκτάθηκε περισσότερο για να περιλάβει φυσικούς εργαζομένους στη στατιστική φυσική (ονομαζομένη επίσης στατιστική μηχανική)

Η στατιστική φυσική ασχολείται με τις μεγάλης κλίμακας στατιστικές ιδιότητες συλλογών πολλών αλληλεπιδρώντων συστατικών Καθώς το Διαδίκτυο έχει αυξηθεί οι Διαδικτυακές μετρήσεις έχουν γίνει πιο επιδεκτικές στα εργαλεία της στατιστικής φυσικής Πολύ από την εστίαση αυτής της εργασίας ήταν στη μελέτη και κατανόηση των ιδιοτήτων μεγάλων γράφων που προέκυψαν από Διαδικτυακές μετρήσεις (πχ ο γράφος δρομολογητών και ο γράφος AS) Το γενικό πεδίο επίσης αναφέρεται ως σύνθετα δίκτυα στη βιβλιογραφία της φυσικής και περιλαμβάνει μελέτη μεγάλων γράφων που προκύπτουν σε άλλα πεδία όπως η βιολογία και η μηχανική

Η τάση προς προσεγγίσεις στατιστικής φυσικής έχει κατευθυνθεί από μια επιθυμία για κατανόηση των γενικών ή μακροσκοπικών ιδιοτήτων του Διαδικτύου σαν συνάρτηση τοπικών ιδιοτήτων όπως επαγγελματικές αποφάσεις που λαμβάνονται από χωριστούς διαχειριστές δικτύου Αυτή η γραμμή έρευνας δεν έχει ακόμη πλήρως επιτύχει αυτό το σκοπό αλλά έχει παρακινήσει ένα ευρύ φάσμα ερωτημάτων και σημαντική τρέχουσα μελέτη Μια πρόσφατη θεώρηση των Διαδικτυακών μετρήσεων από μια οπτική στατιστικής φυσικής δίνεται στο [PSV04]

112 Δυσκολίες

Οι ευρείες τάσεις στη Διαδικτυακή μέτρηση που μόλις περιγράφηκαν έχουν κατευθυνθεί από μια ποικιλία παραγόντων Αυτές οι τάσεις προέρχονται από μια αλληλεπίδραση σκοπών μέτρησης και δυσκολιών μέτρησης

Σε αυτήν την ενότητα επιθεωρούμε τις κύριες δυσκολίες στη Διαδικτυακή μέτρηση και το πώς επηρεάζουν τάσεις στη Διαδικτυακή μέτρηση Καθένα από αυτά τα αντικέιμενα έχει απαντηθεί πολλές φορές στο βιβλίο σε ποικίλες μορφές αυτή η ενότητα εξυπηρετεί να τις συλλέξει και να τις επιθεωρήσει όλες σε ένα μέρος

Θέματα Διαδικτυακής μέτρησης μπορούν ευρέως να διαχωριστούν σε τέσσερις κατηγορίες πρακτικά θέματα στατιστικές δυσκολίες αρχιτεκτονικά θέματα και διαχειριστικά θέματα

Πρακτικά Θέματα Υπάρχει ένα ευρύ φάσμα πρακτικών προβλημάτων που εξασθενούν τη δυνατότητά μας να μετρήσουμε το Διαδίκτυο

Πρώτα ο καθαρός όγκος των δεδομένων είναι μια σημαντική πρόκληση Θέματα όγκου δεδομένων προκύπτουν σε μετρήσεις κυκλοφορίας σε μετρήσεις εφαρμογής και σε μετρήσεις υποδομής Τα μαζικά σύνολα δεδομένων που μπορούν να συλλεγούν παρουσιάζουν μια πρόκληση για αποθήκευση και επεξεργασία Σε περιπτώσεις όπως μέτρηση τοπολογίας η διαδικασία της συλλογής δεδομένων απαιτεί ένα σημαντικό ποσό χρόνου

Ένας επιδεινωτικός παράγοντας είναι ο ρυθμός αλλαγής των αντικειμένων ή ιδιοτήτων που μετρώνται Το σύστημα μπορεί να αλλάξει κατά τη διάρκεια της χρονικής περιόδου που λαμβάνονται μετρήσεις Για παράδειγμα στη μέτρηση τοπολογίας κεντρικοί υπολογιστές και σύνδεσμοι μπορούν να συνδεθούν και αποσυνδεθούν ενόσω λαμβάνει χώρα η μέτρηση Στη μέτρηση Ιστού το περιεχόμενο μπορεί να αλλάξει κατά τη διάρκεια της πορείας ενός γύρου (crawl) Στη μέτρηση P2P οι ομότιμοι μπορούν να συνδεθούν και να εξαφανιστούν κατά τη διάρκεια της μέτρησης Κατά τη διάρκεια μεγαλυτέρων περιόδων μέτρησης οι μέσοι όροι επιπέδων κυκλοφορίας θα τείνουν να αυξάνουν με το χρόνο και το μίγμα των πρωτοκόλλων και εφαρμογών που χρησιμοποιούνται στο δίκτυο θα μετατοπισθεί (όπως έχει συμβεί σε σχέση με εφαρμογές Ιστού και P2P)

711

Αυτή η σταθερή αλλαγή καθιστά δύσκολη την αναγνώριση laquoαντιπροσωπευτικώνraquo συνθηκών σε πολλές καταστάσεις Ένα συγκεκριμένο μίγμα εφαρμογής ή πρότυπο κυκλοφορίας μπορεί μόνο να είναι αντιπροσωπευτικό ορισμένων ειδών δικτύων ή σε ορισμένους χρόνους Ένα συγκεκριμένο μίγμα τύπων χρηστών ή πελατών θα έτεινε να αλλάζει με το χρόνο καθώς νέοι πελάτες συνδέονται ολόγυρα του κόσμου με διαφορετικούς βαθμούς συνδεσμικότητας

Αυτά τα πρακτικά θέματα παρουσιάζουν προκλήσεις που έχουν αντιμετωπισθεί με μια ποικιλία τρόπων Μετρήσεις εκτελούνται αυξανόμενα χρησιμοποιώντας δειγματοληψία για την ελάττωση του όγκου δεδομένων που συλλέγεται Αυτό είχε οδηγήσει σε ενδιαφέρον προς και ανάπτυξη από μεθόδους για συμπερασμό ιδιοτήτων πρωτοτύπων δεδομένων από δειγματοληπτημένες μετρήσεις Όταν δεν μπορούν να δειγματοληφθούν δεδομένα συστήματα για συλλογή αποθήκευση και διαχείριση μεγάλων συνόλων δεδομένων μπορούν να εφαρμοστούν που κάνουν το πρόβλημα λιγότερο οξύ

Στατιστικά Θέματα Σε όλο το βιβλίο έχουμε δεί ότι η εργασία με Διαδικτυακά δεδομένα περιλαμβάνει ασυνήθεις στατιστικές δυσκολίες

Το πιο εξέχον στατιστικό θέμα στη Διαδικτυακή μέτρηση είναι το φαινόμενο της υψηλής μεταβλητότητας Υψηλή μεταβλητότητα εμφανίζεται στην κυκλοφορία (μήκη ροής και σύνδεσης) στην υποδομή (βαθμός κόμβων στους γράφους δρομολογητών και AS) και στις εφαρμογές (μεγέθη αντικειμένων Ιστού) Οι στατιστικές δυσκολίες της εργασίας με πολύ μεταβλητά δεδομένα έχουν αποκαλυφθεί σε προηγούμενα κεφάλαια περιλαμβάνουν την αστάθεια των παραδοσιακών μετρικών όπως ο εμπειρικός μέσος και η διασπορά την ανάγκη για επικέντρωση σε ουρές κατανομών για σκοπούς χαρακτηρισμού και την μετατόπιση της εστίασης σε ασυνήθη (μακρυών ουρών) πιθανοτικά μοντέλα

Ένα επιπλέον θέμα είναι η σταθερότητα Μετρημένες συνθήκες υπόκεινται σε απροσδόκητη αλλαγή κάθε στιγμή βλάβες εξοπλισμού αστραπιαίοι συνωστισμοί και δικτυακή συντήρηση όλα έχουν το δυναμικό να επηρεάσουν δραστικά τις μετρήσεις σε μια σύντομο περίοδο Αυτό κάνει τη μοντελοποίηση πιο δύσκολη στάσιμα μοντέλα μπορεί να είναι ακατάλληλα όταν μεγάλες αλλαγές στις δικτυακές συνθήκες λαμβάνουν χώρα

Έχουμε δει ότι κάποια μέτρα Διαδικτυακών ιδιοτήτων επιδεικνύουν ισχυρή μνήμη Κυρίως η κυκλοφορία δικτύου δείχνει εξάρτηση μεγάλου βεληνεκούς Αυτό κάνει τη μοντελοποίηση προκλητική απαιτώντας τη χρήση πιο εξεζητημένων μοντέλων στην περιγραφή δικτυακής κυκλοφορίας Η προσομοίωση και ο υπολογισμός απόδοσης είναι επίσης πιο δύσκολα σαν αποτέλεσμα της ισχυρής μνήμης στη δικτυακή κυκλοφορία

Αρχιτεκτονικά Θέματα Ένας αριθμός δυσκολιών στη Διαδικτυακή μέτρηση προέρχονται από ιδιότητες της αρχιτεκτονικής του Διαδικτύου

Η απλότητα πυρήνα αναφέρεται στην ιδέα ότι ενδοδικτυακά στοιχεία (δρομολογητές και μεταγωγείς) πρέπει να είναι σχετικά απλές συσκευές Έχουμε δει ότι ένας τρόπος που τέτοιες συσκευές μπορεί να απλοποιηθούν είναι να παραλειφθούν εξεζητημένες δυνατότητες μέτρησης Έτσι είναι γενικά δύσκολο να αποκτηθεί πληροφορία από δικτυακά στοιχεία σχετικά με μήκη ουρών σε δρομολογητές ή απώλεια και καθυστέρηση χωριστών πακέτων

Μια άλλη διάσταση της απλότητας πυρήνα είναι ότι επίπεδα πρωτοκόλλων πάνω από το IP συχνά δεν ιχνηλατούνται στους δρομολογητές και μεταγωγείς Έτσι για παράδειγμα μπορεί να είναι δύσκολο να παρακολουθηθεί η κυκλοφορία στο επίπεδο ροής ή σε άλλα επίπεδα υψηλότερα από αυτά των πακέτων

Η κλεψύδρα IP επίσης δημιουργεί προβλήματα κρύπτοντας πληροφορία σχετικά με επίπεδα κάτω από το IP Πακέτα μπορούν να περάσουν πάνω από ένα φάσμα διαφορετικών φυσικών μέσων με ιδιότητες που ποικίλουν ευρέως ndash για παράδειγμα ασύρματα LAN οπτική ίνα καλώδιο χαλκού και σύνδεσμοι δορυφόρου Κάποια από αυτά τα μέσα μπορεί να

811

εφαρμόζουν επαναμετάδοση ή διόρθωση εμπροσθίου σφάλματος αποκρύπτοντας τη φθορά πακέτου στο φυσικό επίπεδο Η μέτρηση στο επίπεδο πακέτου (IP) γενικά δεν περιλαμβάνει πληροφορίες σχετικά με λεπτομέρειες όπως αυτές σε χαμηλότερα επίπεδα

Τελικά το γεγονός ότι το Διαδίκτυο έχει μια αποκεντρωμένη οργάνωση σε πολλά επίπεδα σημαίνει ότι δεν υπάρχει πραγματικά κεντρική τοποθεσία στο δίκτυο για σκοπούς παρακολούθησης Για παράδειγμα υπάρχουν πολλά αυτόνομα συστήματα ανωτάτου επιπέδου στο Διαδίκτυο και ένα πακέτο μπορεί να ρεύσει μέσω οποιουδήποτε (ή κανενός) από αυτά Επιπλέον τα αυτόνομα συστήματα ανωτάτου επιπέδου γενικά συνδέονται μεταξύ τους σε πολλαπλές τοποθεσίες Αυτή η πλεγματοειδής δομή σημαίνει ότι μετρήσεις που γίνονται σε κάθε μονό σημείο αναπόφευκτα χάνουν ένα μεγάλο κλάσμα κυκλοφορίας δικτύου

Διαχειριστικά θέματα Όπως είδαμε το Διαδίκτυο είναι ένα δίκτυο δικτύων τα συστατικά δίκτυα κατέχονται και λειτουργούνται από ανεξάρτητες οντότητες ndash τους Παρόχους Υπηρεσιών Δικτύου (ISP) Πολλοί ISP είναι κερδοσκοπικές οντότητες σε ανταγωνισμό μεταξύ τους

Σαν αποτέλεσμα οι ISP αντιστέκονται στη διάθεση σημαντικής πληροφορίας εκτός του οργανισμού τους επειδή αυτή η πληροφορία μπορεί να χρησιμοποιηθεί από τον ανταγωνιστή τους Για παράδειγμα οι ISP γενικά δε δημοσιεύουν πόση κυκλοφορία μεταφέρουν τα δίκτυά τους ή το μέγεθος ή την ακριβή φυσική διάταξη των δικτύων τους ή τη σύνθεση της κυκλοφορίας τους (όπως το μίγμα εφαρμογής ή η διάδοση κακόβουλης κυκλοφορίας)

Η έλλειψη εξωτερικής πληροφορίας σχετικά με ξεχωριστά λειτουργούμενα δίκτυα εμποδίζει πολλούς αξιέπαινους σκοπούς Για παράδειγμα αυτή η μυστικότητα εξασθενεί την ικανότητά μας να ανιχνεύσουμε ξεσπάσματα λογισμικού σκουληκιού (worm) ανά το δίκτυο ή να κατανοήσουμε το ρυθμό αύξησης της δικτυακής κυκλοφορίας παγκοσμίως

113 Μελλοντική Εργασία

Οι δυσκολίες που συγκαταριθμήθηκαν στην τελευταία ενότητα παρέχουν ένα πλαίσιο για την κατανόηση του πώς η μελλοντική Διαδικτυακή μέτρηση θα περιοριστεί και προκληθεί Σε αυτήν την ενότητα ρίχνουμε μια ματιά στις τάσεις μέτρησης που μπορούν να προβλεφθούν στο μέλλον

1131 Ερευνητικές Προκλήσεις Η προσπάθεια να αυξηθεί η Διαδικτυακή κατανόησή μας οδηγεί σε έναν αριθμό

ερευνητικών προκλήσεων Αυτές αντιπροσωπεύουν ερωτήματα σχετικά με το πώς η Διαδικτυακή μέτρηση θα έπρεπε να διεξαχθεί στο μέλλον

Πλατφόρμες Μέτρησης Σε προηγούμενες ενότητες έχουμε δει ότι υπάρχουν πολλές ανικανοποίητες προκλήσεις στη μέτρηση του Διαδικτύου από την άλλη πλευρά η δραστηριότητα στη Διαδικτυακή μέτρηση έχει αυξηθεί δραματικά στα τελευταία χρόνια Αυτά τα δύο γεγονότα δείχνουν ότι φαίνεται αξιόλογο να ανατεθεί αυξημένη προσπάθεια στην κατασκευή πλατφορμών και υποδομής για Διαδικτυακή μέτρηση

Τα έργα που συζητήθηκαν στο Κεφάλαιο 10 δείχνουν ότι ένα φάσμα αρχιτεκτονικών επιλογών είναι δυνατό στην κατασκευή πλατφορμών μέτρησης [EMG] Αυτές οι επιλογές επηρεάζουν τη χρησιμότητα και την μακροπρόθεσμη επιτυχία των προσπαθειών μέτρησης που χρησιμοποιούν αυτές οι πλατφόρμες Κάποιες από τις θεωρήσεις είναι

bull Ποιος θα έπρεπε να χρηματοδοτήσει την υποδομή μέτρησης για το Διαδίκτυο Και κυβερνητικές και εμπορικές προσεγγίσεις είναι δυνατές

bull Θα έπρεπε μια υποδομή μέτρησης να ελεγχθεί από ένα μόνο οργανισμό ή θα έπρεπε ο έλεγχός του να μοιράζεται από πολλαπλούς διερευνητές ή ομάδες

911

bull Πώς θα έπρεπε να χρησιμοποιηθούν τα συστήματα μέτρησης Πώς θα έπρεπε να ληφθούν αποφάσεις αναφορικά με τη σχετική έμφαση σε διαφορετικούς σκοπούς για μια πλατφόρμα μέτρησης

bull Θα έπρεπε να κατασκευαστούν εξειδικευμένες πλατφόρμες μέτρησης ίσως για συγκεκριμένες κοινότητες χρηστών ή για την απάντηση συγκεκριμένων ζητημάτων Αν μια πλατφόρμα πρέπει να είναι γενικής χρήσης τι μορφή θα έπρεπε να πάρει

Η κατασκευή πλατφορμών μέτρησης ευρείας κλίμακας έχει το δυναμικό να κάνει πρόοδο σε θεμελιώδη ανοιχτά ερωτήματα αναφορικά με το Διαδίκτυο Για παράδειγμα η παγκόσμια τοπολογία του Διαδικτύου είναι ανεπαρκώς γνωστή και θα μπορούσε να ερευνηθεί πληρέστερα η φύση και διάδοση κακόβουλης δραστηριότητας στο Διαδίκτυο θα μπορούσε να εκτιμηθεί ακριβέστερα και ο βαθμός στον οποίο η κυκλοφορία αυξάνει και αλλάζει στο Διαδίκτυο θα μπορούσε να κατανοηθεί καλύτερα

Αποτελέσματα Διαμοιραζόμενης Μέτρησης Επίσης σημειώνουμε ότι ένω η απόκτηση Διαδικτυακών μετρήσεων μπορεί να απαιτεί σημαντική προσπάθεια σε πολλές περιπτώσεις μετρήσεις χρησιμοποιούνται μόνο για μια μόνη μελέτη η μόνο από τον οργανισμό που κάνει τις μετρήσεις

Αυτό δείχνει ότι περισσότερη εργασία θα έπρεπε να γίνει για να ξεπεραστούν οι φραγμοί στο συχνό διαμοιρασμό των μετρήσεων ή σχετιζομένων δεδομένων Αυτοί οι φραγμοί περιλαμβάνουν

bull Οι οργανισμοί μπορεί να έχουν μονοπωλιακό ενδιαφέρον σε κάποια είδη δεδομένων που ελέγχουν αλλά όχι σε άλλα Υπάρχει μια ανάγκη για μεθόδους για να γίνουν διαθέσιμες οι μετρήσεις με τρόπους που δεν απελευθερώνουν εμπορικά ευαίσθητη πληροφορία

bull Είναι συχνά μάλλον δύσκολο να τεθούν σύνολα δεδομένων μέτρησης σε μια μορφή που άλλα μπορούν να χρησιμοποιήσουν Είναι σημαντικό να κατανοηθεί και τεκμηριωθεί το πώς έγιναν οι μετρήσεις η ποιότητα των δεδομένων (συμπεριλαμβανομένης της σημείωσης του ποιά σημεία δεδομένων είναι εσφαλμένα) η μορφή των δεδομένων και οι υποθέσεις που υπόκεινται της συλλογής δεδομένων Αυτή η προσπάθεια παίρνει χρόνο

bull Η αποθήκευση και η κατανομή μεγάλων συνόλων δεδομένων μπορεί να απαιτεί σημαντκούς πόρους συμπεριλαμβανομένων του χώρου δίσκου και της χωρητικότητας δικτύου Αυτοί οι πόροι είναι ακριβοί και η χρήση τους πρέπει να δικαιολογηθεί

Η έρευνα σε αυτήν την περιοχή είναι σημαντική επειδή ο διαμοιρασμός μετρήσεων έχει πολλές ωφέλειες Σημαίνει ότι η προσπάθεια στην απόκτηση μετρήσεων ξεπληρώνεται με πολλαπλές χρήσεις Επιτρέπει τα ερευνητικά αποτελέσματα που βασίζονται στην ανάλυση των δεδομένων να επαληθευτούν ανεξάρτητα Και επιτρέπει νέα ερωτήματα να ερωτηθούν ερωτήματα που μπορεί να μην ήταν η βάση για την πρωτότυπη προσπάθεια μέτρησης

1132 Αναδυόμενα Ερωτήματα Ολοκληρώνοντας το βιβλίο είναι φυσικό να ερωτούμε ποια είναι τα επόμενα βήματα στη

Διαδικτυακή μέτρηση Πού πηγαίνει το πεδίο και ποια αναδυόμενα ερωτήματα μπορούν να προβλεφθούν Βεβαίως είναι αδύνατο να απαντηθούν πλήρως αυτές οι ερωτήσεις αλλά σε αυτήν την ενότητα προτείνουμε κάποιες μερικές απαντήσεις Χωρίζουμε τα θέματα σε βραχυπρόθεσμα και πιο μακροπρόθεσμα ερωτήματα μέτρησης

Βραχυπρόθεσμα Αυτό το βιβλίο έχει καλύψει ένα ευρύ φάσμα θεμάτων στη Διαδικτυακή μέτρηση Τα υποπεδία της υποδομής κυκλοφορίας και μέτρησης εφαρμογής είναι το καθένα σύνθετο αυτό καθαυτό Επιπλέον οι σχετιζόμενες περιοχές της ανωνυμοποίησης και ασφάλειας περιέχουν πολλά προσθέτα θέματα Παρόλα αυτά υπάρχουν περισσότερα στη

1011

Διαδικτυακή μέτρηση που μπορούν να προβλεφθούν στο κοντινό μέλλον Πολλά από αυτά τα θέματα αρχίζουν να μελετώνται αλλά δεν είναι ακόμη αναπτυγμένα ή αρκετά ώριμα για να καλυφθούν σε αυτό το βιβλίο

Η περιοχή των μετρήσεων ασυρμάτου Διαδικτύου είναι μια σημαντική αναδυόμενη περιοχή Από τη μία πλευρά η μετάδοση ασυρμάτων δεδομένων έχει χρησιμοποιηθεί στο Διαδίκτυο από τις πρώτες του μέρες ως το ARPANET Όμως στα πρώτα πειράματα του ARPANET ασύρματοι σύνδεσμοι χρησιμοποιήθηκαν για συνδέσεις δικτύου κορμού σε μακρινές τοποθεσίες συνήθως μέσω δορυφόρου Σε αντίθεση η σημασία των ασυρμάτων συνδέσμων έχει αυξηθεί δραματικά πιο πρόσφατα με την εισαγωγή της τεχνολογίας ασυρμάτων LAN Οι πιο αξιοσημείωτοι από αυτούς είναι τα πρωτόκολλα που βασίζονται στο σύνολο προτύπων IEEE 80211 (πχ WiFi)

Η φύση της ασύρματης μέτρησης είναι μάλλον διαφορετική από τη μέτρηση του ενσύρματου Διαδικτύου Η ασύρματη μέτρηση βασίζεται στη σύλληψη μετάδοσης ραδιοκυμάτων Αυτό σημαίνει ότι η ακριβής ασύρματη μέτρηση και η σωστή μετάφραση αυτών των μετρήσεων περιλαμβάνει νέα θέματα και περιορισμούς Σαν αποτέλεσμα το πεδίο της ασύρματης Διαδικτυακής μέτρησης είναι ακόμη σε υπό διαμόρφωσιν στάδια σχετικά λίγες καθοριστικές μελέτες έχουν διεξαχθεί ως τώρα

Μια άλλη αναδυόμενη περιοχή είναι τα δίκτυα αισθητήρα Αυτά είναι δίκτυα συσκευών χαμηλής ισχύος που αναμένεται να σχηματίσουν δίκτυα χωρίς σημαντική υποδομιακή υποστήριξη Υπάρχουν σημαντικά θέματα μέτρησης σχετιζόμενα με αυτά τα δίκτυα Όμως το πεδίο είναι ακόμη νεότερο από αυτό της ασυρμάτου δικτύωσης γενικά και η εργασία δεν είναι ακόμη ώριμη σε αυτήν την περιοχή

Γυρίζοντας στο ενσύρματο Διαδίκτυο ένα θέμα που δεν έχει ακόμη μελετηθεί σε βάθος είναι μετρήσεις δικτύων και κυκλοφορίας IPv6 Ενώ το πρωτόκολλο IPv6 έχει λειτουργήσει για ένα αριθμό ετών η υιοθέτηση του δεν είναι ακόμη ευρέως διαδεδομένη Σε πολλά σημεία η συμπεριφορά του IPv6 διαφέρει από το IPv4 σε μόνο λίγα σημεία αναφορικά με τις μετρήσεις έτσι δεν έχουμε εστιάσει στο IPv6 σε μεγάλο βαθμό στο βιβλίο Όμως καθώς το IPv6 γίνεται πιο ευρέως διαδεδομένο είναι πιθανό ότι νέα θέματα μέτρησης θα προκύψουν

Επιπρόσθετα όπως σημειώθηκε παραπάνω η σουίτα των εφαρμογών που χρησιμοποιούνται στο Διαδίκτυο είναι σε μια συνεχή ρευστότητα Ενώ μπορούμε να αναγνωρίσουμε γενικά μετατοπίσεις στους κυρίαρχους τύπους εφαρμογών πχ από τον Ιστό στο P2P υπάρχουν επίσης σημαντικές δευτερεύουσες μετατοπίσεις Για παράδειγμα εντός του συνόλου εφαρμογής P2P πρώιμες εφαρμογές όπως το KaZaa έχουν παραχωρήσει προτεραιότητα σε πιο πρόσφατες παραλλαγές όπως το BitTorrent Αυτές οι εφαρμογές είναι αρκετά διαφορετικές σε πολλά σημεία και αυτές οι μετατοπίσεις από μια κυρίαρχη εφαρμογή σε μια άλλη έχουν ένα σημαντικό αποτέλεσμα στη φύση της κυκλοφορίας Κοιτάζοντας στο μέλλον δικτυωμένα παιχνίδια έχουν το δυναμικό να γίνουν μια κυρίαρχη εφαρμογή (τουλάχιστον υπό όρους χρηστών αν όχι υπό όρους συνολικής κυκλοφορίας) Έχουμε προσπαθήσει να δώσουμε έμφαση στα μακροχρόνια αποτελέσματα στην περιοχή των Διαδικτυακών εφαρμογών Όμως καθώς νέες εφαρμογές αναδύονται θα υπάρξει μια φυσική μετατόπιση στην εστίαση της προσοχής μέτρησης

Τελικά έχουμε σημειώσει ότι υπάρχει σημαντικό ενδιαφέρον σε στατιστικά μοντέλα φυσικής για ιδιότητες Διαδικτύου Αυτή είναι μια περιοχή έρευνας που συχνά γεφυρώνει επιπλέον θέματα στη βιοπληροφορική κοινωνιολογία και μηχανική Δεν είχαμε το χώρο να καλύψουμε αυτό το ευρύτερο σύνολο θεμάτων Όμως έχουμε δώσει μια επισκόπηση των συνεισφορών της στατιστικής φυσικής μέχρι σήμερα στη Διαδικτυακή μοντελοποίηση και έχουμε δώσει αναφορές σε αυτήν την ερευνητική βιβλιογραφία όπου είναι σχετικό Δραστηριότητα σε αυτήν την περιοχή πιθανό να συνεχίσει και αυξηθεί στο κοντινό μέλλον

1111

Πιο Μακροπρόθεσμα Μια από τις πιο ανοικτού τέλους μελλοντικές κατευθύνσεις αφορά το τι και πώς νέα ερωτήματα θα αναδυθούν στη Διαδικτυακή μέτρηση Έχουμε δει ότι τα είδη των ερωτημάτων που διευθετήθηκαν στη Διαδικτυακή μέτρηση έχουν εξελιχθεί με το χρόνο σε πολλές περιπτώσεις η ανάδυση νέων ερωτημάτων ήταν δύσκολο να προβλεφθεί

Για παράδειγμα η έκρηξη του Παγκοσμίου Ιστού από τις αρχές ως τα μέσα της δεκαετίας του 1990 προκάλεσαν ένα τεράστιο ποσό έρευνας Από τη μια πλευρά αυτή η έρευνα ήταν κυρίως κατευθυνόμενη από τη δημοτικότητα του Ιστού ndash για παράδειγμα ένας αριθμός κατανεμημένων πληροφοριακών συστημάτων προϋπήρξε του Ιστού αλλά αυτά δεν υπόκειντο σε σημαντική προσοχή μέτρησης Από την άλλη πλευρά αυτή η έρευνα επέδειξε έναν αριθμό αποτελεσμάτων που μπορεί να θεωρηθούν θεμελιώδη όπως η παρουσία υψηλής μεταβλητότητας στα μεγέθη και τη δημοτικότητα των αντικειμένων Ιστού

Αυτό το παράδειγμα δείχνει ότι κάποια πιο μακροπρόθεσμα αναδυόμενα ερωτήματα μπορεί να κατευθυνθούν από νέες laquoεφαρμογές φονείςraquo ή από νέους τρόπους χρήσης του Διαδικτύου Αυτά είναι εξ ορισμού δύσκολο να προβλεφθούν

Ένα άλλο σύνολο πιο μακροπρόθεσμων ερωτημάτων αφορά την αυξανόμενη ενσωμάτωση του Διαδικτύου στην κοινωνία Ως τέτοια νέα ερωτήματα μέτρησης θα προκύψουν αναμφισβήτητα σε σχέση με την ανθρώπινη δραστηριότητα Για παράδειγμα καθώς η χρήση του Διαδικτύου έχει αυξηθεί στο εμπόριο υπάρχει αυξανόμενη σπουδαιότητα στην κατανόηση κακόβουλης δραστηριότητας τη μέτρηση γεωγραφικής τοποθεσίας και τη διερεύνηση της σχέσης μεταξύ της οικονομικής ανάπτυξης και της Διαδικτυακής υποδομής Αυτά τα ερωτήματα αρχίζουν να διευθετούνται μέσω εργασίας στην ασφάλεια την ανωνυμοποίηση και άλλα πεδία αλλά υπάρχουν αναμφίβολα πολλά σημαντικά ερωτήματα ακόμη να αναδυθούν

Βιβλιογραφία

Crovella M Krishnamurthy B 2006 Internet Measurement Infrastructure Traffic and Applications John Wiley amp Sons Inc 2006

ΤΕΛΟΣ ΚΑΙ Τῼ ΘΕῼ ΔΟΞΑ

  • 111 Τάσεις στη Διαδικτυακή Μέτρηση
  • 112 Δυσκολίες
  • 113 Μελλοντική Εργασία
    • 1131 Ερευνητικές Προκλήσεις
    • 1132 Αναδυόμενα Ερωτήματα
      • Βιβλιογραφία
Page 7: Μετάφραση τοῦ κεφαλαίου 11 τοῦ βιβλίου «Internet Measurement: Infrastructure, Traffic and Applications» [Translation of chapter 11 of the book «Internet

711

Αυτή η σταθερή αλλαγή καθιστά δύσκολη την αναγνώριση laquoαντιπροσωπευτικώνraquo συνθηκών σε πολλές καταστάσεις Ένα συγκεκριμένο μίγμα εφαρμογής ή πρότυπο κυκλοφορίας μπορεί μόνο να είναι αντιπροσωπευτικό ορισμένων ειδών δικτύων ή σε ορισμένους χρόνους Ένα συγκεκριμένο μίγμα τύπων χρηστών ή πελατών θα έτεινε να αλλάζει με το χρόνο καθώς νέοι πελάτες συνδέονται ολόγυρα του κόσμου με διαφορετικούς βαθμούς συνδεσμικότητας

Αυτά τα πρακτικά θέματα παρουσιάζουν προκλήσεις που έχουν αντιμετωπισθεί με μια ποικιλία τρόπων Μετρήσεις εκτελούνται αυξανόμενα χρησιμοποιώντας δειγματοληψία για την ελάττωση του όγκου δεδομένων που συλλέγεται Αυτό είχε οδηγήσει σε ενδιαφέρον προς και ανάπτυξη από μεθόδους για συμπερασμό ιδιοτήτων πρωτοτύπων δεδομένων από δειγματοληπτημένες μετρήσεις Όταν δεν μπορούν να δειγματοληφθούν δεδομένα συστήματα για συλλογή αποθήκευση και διαχείριση μεγάλων συνόλων δεδομένων μπορούν να εφαρμοστούν που κάνουν το πρόβλημα λιγότερο οξύ

Στατιστικά Θέματα Σε όλο το βιβλίο έχουμε δεί ότι η εργασία με Διαδικτυακά δεδομένα περιλαμβάνει ασυνήθεις στατιστικές δυσκολίες

Το πιο εξέχον στατιστικό θέμα στη Διαδικτυακή μέτρηση είναι το φαινόμενο της υψηλής μεταβλητότητας Υψηλή μεταβλητότητα εμφανίζεται στην κυκλοφορία (μήκη ροής και σύνδεσης) στην υποδομή (βαθμός κόμβων στους γράφους δρομολογητών και AS) και στις εφαρμογές (μεγέθη αντικειμένων Ιστού) Οι στατιστικές δυσκολίες της εργασίας με πολύ μεταβλητά δεδομένα έχουν αποκαλυφθεί σε προηγούμενα κεφάλαια περιλαμβάνουν την αστάθεια των παραδοσιακών μετρικών όπως ο εμπειρικός μέσος και η διασπορά την ανάγκη για επικέντρωση σε ουρές κατανομών για σκοπούς χαρακτηρισμού και την μετατόπιση της εστίασης σε ασυνήθη (μακρυών ουρών) πιθανοτικά μοντέλα

Ένα επιπλέον θέμα είναι η σταθερότητα Μετρημένες συνθήκες υπόκεινται σε απροσδόκητη αλλαγή κάθε στιγμή βλάβες εξοπλισμού αστραπιαίοι συνωστισμοί και δικτυακή συντήρηση όλα έχουν το δυναμικό να επηρεάσουν δραστικά τις μετρήσεις σε μια σύντομο περίοδο Αυτό κάνει τη μοντελοποίηση πιο δύσκολη στάσιμα μοντέλα μπορεί να είναι ακατάλληλα όταν μεγάλες αλλαγές στις δικτυακές συνθήκες λαμβάνουν χώρα

Έχουμε δει ότι κάποια μέτρα Διαδικτυακών ιδιοτήτων επιδεικνύουν ισχυρή μνήμη Κυρίως η κυκλοφορία δικτύου δείχνει εξάρτηση μεγάλου βεληνεκούς Αυτό κάνει τη μοντελοποίηση προκλητική απαιτώντας τη χρήση πιο εξεζητημένων μοντέλων στην περιγραφή δικτυακής κυκλοφορίας Η προσομοίωση και ο υπολογισμός απόδοσης είναι επίσης πιο δύσκολα σαν αποτέλεσμα της ισχυρής μνήμης στη δικτυακή κυκλοφορία

Αρχιτεκτονικά Θέματα Ένας αριθμός δυσκολιών στη Διαδικτυακή μέτρηση προέρχονται από ιδιότητες της αρχιτεκτονικής του Διαδικτύου

Η απλότητα πυρήνα αναφέρεται στην ιδέα ότι ενδοδικτυακά στοιχεία (δρομολογητές και μεταγωγείς) πρέπει να είναι σχετικά απλές συσκευές Έχουμε δει ότι ένας τρόπος που τέτοιες συσκευές μπορεί να απλοποιηθούν είναι να παραλειφθούν εξεζητημένες δυνατότητες μέτρησης Έτσι είναι γενικά δύσκολο να αποκτηθεί πληροφορία από δικτυακά στοιχεία σχετικά με μήκη ουρών σε δρομολογητές ή απώλεια και καθυστέρηση χωριστών πακέτων

Μια άλλη διάσταση της απλότητας πυρήνα είναι ότι επίπεδα πρωτοκόλλων πάνω από το IP συχνά δεν ιχνηλατούνται στους δρομολογητές και μεταγωγείς Έτσι για παράδειγμα μπορεί να είναι δύσκολο να παρακολουθηθεί η κυκλοφορία στο επίπεδο ροής ή σε άλλα επίπεδα υψηλότερα από αυτά των πακέτων

Η κλεψύδρα IP επίσης δημιουργεί προβλήματα κρύπτοντας πληροφορία σχετικά με επίπεδα κάτω από το IP Πακέτα μπορούν να περάσουν πάνω από ένα φάσμα διαφορετικών φυσικών μέσων με ιδιότητες που ποικίλουν ευρέως ndash για παράδειγμα ασύρματα LAN οπτική ίνα καλώδιο χαλκού και σύνδεσμοι δορυφόρου Κάποια από αυτά τα μέσα μπορεί να

811

εφαρμόζουν επαναμετάδοση ή διόρθωση εμπροσθίου σφάλματος αποκρύπτοντας τη φθορά πακέτου στο φυσικό επίπεδο Η μέτρηση στο επίπεδο πακέτου (IP) γενικά δεν περιλαμβάνει πληροφορίες σχετικά με λεπτομέρειες όπως αυτές σε χαμηλότερα επίπεδα

Τελικά το γεγονός ότι το Διαδίκτυο έχει μια αποκεντρωμένη οργάνωση σε πολλά επίπεδα σημαίνει ότι δεν υπάρχει πραγματικά κεντρική τοποθεσία στο δίκτυο για σκοπούς παρακολούθησης Για παράδειγμα υπάρχουν πολλά αυτόνομα συστήματα ανωτάτου επιπέδου στο Διαδίκτυο και ένα πακέτο μπορεί να ρεύσει μέσω οποιουδήποτε (ή κανενός) από αυτά Επιπλέον τα αυτόνομα συστήματα ανωτάτου επιπέδου γενικά συνδέονται μεταξύ τους σε πολλαπλές τοποθεσίες Αυτή η πλεγματοειδής δομή σημαίνει ότι μετρήσεις που γίνονται σε κάθε μονό σημείο αναπόφευκτα χάνουν ένα μεγάλο κλάσμα κυκλοφορίας δικτύου

Διαχειριστικά θέματα Όπως είδαμε το Διαδίκτυο είναι ένα δίκτυο δικτύων τα συστατικά δίκτυα κατέχονται και λειτουργούνται από ανεξάρτητες οντότητες ndash τους Παρόχους Υπηρεσιών Δικτύου (ISP) Πολλοί ISP είναι κερδοσκοπικές οντότητες σε ανταγωνισμό μεταξύ τους

Σαν αποτέλεσμα οι ISP αντιστέκονται στη διάθεση σημαντικής πληροφορίας εκτός του οργανισμού τους επειδή αυτή η πληροφορία μπορεί να χρησιμοποιηθεί από τον ανταγωνιστή τους Για παράδειγμα οι ISP γενικά δε δημοσιεύουν πόση κυκλοφορία μεταφέρουν τα δίκτυά τους ή το μέγεθος ή την ακριβή φυσική διάταξη των δικτύων τους ή τη σύνθεση της κυκλοφορίας τους (όπως το μίγμα εφαρμογής ή η διάδοση κακόβουλης κυκλοφορίας)

Η έλλειψη εξωτερικής πληροφορίας σχετικά με ξεχωριστά λειτουργούμενα δίκτυα εμποδίζει πολλούς αξιέπαινους σκοπούς Για παράδειγμα αυτή η μυστικότητα εξασθενεί την ικανότητά μας να ανιχνεύσουμε ξεσπάσματα λογισμικού σκουληκιού (worm) ανά το δίκτυο ή να κατανοήσουμε το ρυθμό αύξησης της δικτυακής κυκλοφορίας παγκοσμίως

113 Μελλοντική Εργασία

Οι δυσκολίες που συγκαταριθμήθηκαν στην τελευταία ενότητα παρέχουν ένα πλαίσιο για την κατανόηση του πώς η μελλοντική Διαδικτυακή μέτρηση θα περιοριστεί και προκληθεί Σε αυτήν την ενότητα ρίχνουμε μια ματιά στις τάσεις μέτρησης που μπορούν να προβλεφθούν στο μέλλον

1131 Ερευνητικές Προκλήσεις Η προσπάθεια να αυξηθεί η Διαδικτυακή κατανόησή μας οδηγεί σε έναν αριθμό

ερευνητικών προκλήσεων Αυτές αντιπροσωπεύουν ερωτήματα σχετικά με το πώς η Διαδικτυακή μέτρηση θα έπρεπε να διεξαχθεί στο μέλλον

Πλατφόρμες Μέτρησης Σε προηγούμενες ενότητες έχουμε δει ότι υπάρχουν πολλές ανικανοποίητες προκλήσεις στη μέτρηση του Διαδικτύου από την άλλη πλευρά η δραστηριότητα στη Διαδικτυακή μέτρηση έχει αυξηθεί δραματικά στα τελευταία χρόνια Αυτά τα δύο γεγονότα δείχνουν ότι φαίνεται αξιόλογο να ανατεθεί αυξημένη προσπάθεια στην κατασκευή πλατφορμών και υποδομής για Διαδικτυακή μέτρηση

Τα έργα που συζητήθηκαν στο Κεφάλαιο 10 δείχνουν ότι ένα φάσμα αρχιτεκτονικών επιλογών είναι δυνατό στην κατασκευή πλατφορμών μέτρησης [EMG] Αυτές οι επιλογές επηρεάζουν τη χρησιμότητα και την μακροπρόθεσμη επιτυχία των προσπαθειών μέτρησης που χρησιμοποιούν αυτές οι πλατφόρμες Κάποιες από τις θεωρήσεις είναι

bull Ποιος θα έπρεπε να χρηματοδοτήσει την υποδομή μέτρησης για το Διαδίκτυο Και κυβερνητικές και εμπορικές προσεγγίσεις είναι δυνατές

bull Θα έπρεπε μια υποδομή μέτρησης να ελεγχθεί από ένα μόνο οργανισμό ή θα έπρεπε ο έλεγχός του να μοιράζεται από πολλαπλούς διερευνητές ή ομάδες

911

bull Πώς θα έπρεπε να χρησιμοποιηθούν τα συστήματα μέτρησης Πώς θα έπρεπε να ληφθούν αποφάσεις αναφορικά με τη σχετική έμφαση σε διαφορετικούς σκοπούς για μια πλατφόρμα μέτρησης

bull Θα έπρεπε να κατασκευαστούν εξειδικευμένες πλατφόρμες μέτρησης ίσως για συγκεκριμένες κοινότητες χρηστών ή για την απάντηση συγκεκριμένων ζητημάτων Αν μια πλατφόρμα πρέπει να είναι γενικής χρήσης τι μορφή θα έπρεπε να πάρει

Η κατασκευή πλατφορμών μέτρησης ευρείας κλίμακας έχει το δυναμικό να κάνει πρόοδο σε θεμελιώδη ανοιχτά ερωτήματα αναφορικά με το Διαδίκτυο Για παράδειγμα η παγκόσμια τοπολογία του Διαδικτύου είναι ανεπαρκώς γνωστή και θα μπορούσε να ερευνηθεί πληρέστερα η φύση και διάδοση κακόβουλης δραστηριότητας στο Διαδίκτυο θα μπορούσε να εκτιμηθεί ακριβέστερα και ο βαθμός στον οποίο η κυκλοφορία αυξάνει και αλλάζει στο Διαδίκτυο θα μπορούσε να κατανοηθεί καλύτερα

Αποτελέσματα Διαμοιραζόμενης Μέτρησης Επίσης σημειώνουμε ότι ένω η απόκτηση Διαδικτυακών μετρήσεων μπορεί να απαιτεί σημαντική προσπάθεια σε πολλές περιπτώσεις μετρήσεις χρησιμοποιούνται μόνο για μια μόνη μελέτη η μόνο από τον οργανισμό που κάνει τις μετρήσεις

Αυτό δείχνει ότι περισσότερη εργασία θα έπρεπε να γίνει για να ξεπεραστούν οι φραγμοί στο συχνό διαμοιρασμό των μετρήσεων ή σχετιζομένων δεδομένων Αυτοί οι φραγμοί περιλαμβάνουν

bull Οι οργανισμοί μπορεί να έχουν μονοπωλιακό ενδιαφέρον σε κάποια είδη δεδομένων που ελέγχουν αλλά όχι σε άλλα Υπάρχει μια ανάγκη για μεθόδους για να γίνουν διαθέσιμες οι μετρήσεις με τρόπους που δεν απελευθερώνουν εμπορικά ευαίσθητη πληροφορία

bull Είναι συχνά μάλλον δύσκολο να τεθούν σύνολα δεδομένων μέτρησης σε μια μορφή που άλλα μπορούν να χρησιμοποιήσουν Είναι σημαντικό να κατανοηθεί και τεκμηριωθεί το πώς έγιναν οι μετρήσεις η ποιότητα των δεδομένων (συμπεριλαμβανομένης της σημείωσης του ποιά σημεία δεδομένων είναι εσφαλμένα) η μορφή των δεδομένων και οι υποθέσεις που υπόκεινται της συλλογής δεδομένων Αυτή η προσπάθεια παίρνει χρόνο

bull Η αποθήκευση και η κατανομή μεγάλων συνόλων δεδομένων μπορεί να απαιτεί σημαντκούς πόρους συμπεριλαμβανομένων του χώρου δίσκου και της χωρητικότητας δικτύου Αυτοί οι πόροι είναι ακριβοί και η χρήση τους πρέπει να δικαιολογηθεί

Η έρευνα σε αυτήν την περιοχή είναι σημαντική επειδή ο διαμοιρασμός μετρήσεων έχει πολλές ωφέλειες Σημαίνει ότι η προσπάθεια στην απόκτηση μετρήσεων ξεπληρώνεται με πολλαπλές χρήσεις Επιτρέπει τα ερευνητικά αποτελέσματα που βασίζονται στην ανάλυση των δεδομένων να επαληθευτούν ανεξάρτητα Και επιτρέπει νέα ερωτήματα να ερωτηθούν ερωτήματα που μπορεί να μην ήταν η βάση για την πρωτότυπη προσπάθεια μέτρησης

1132 Αναδυόμενα Ερωτήματα Ολοκληρώνοντας το βιβλίο είναι φυσικό να ερωτούμε ποια είναι τα επόμενα βήματα στη

Διαδικτυακή μέτρηση Πού πηγαίνει το πεδίο και ποια αναδυόμενα ερωτήματα μπορούν να προβλεφθούν Βεβαίως είναι αδύνατο να απαντηθούν πλήρως αυτές οι ερωτήσεις αλλά σε αυτήν την ενότητα προτείνουμε κάποιες μερικές απαντήσεις Χωρίζουμε τα θέματα σε βραχυπρόθεσμα και πιο μακροπρόθεσμα ερωτήματα μέτρησης

Βραχυπρόθεσμα Αυτό το βιβλίο έχει καλύψει ένα ευρύ φάσμα θεμάτων στη Διαδικτυακή μέτρηση Τα υποπεδία της υποδομής κυκλοφορίας και μέτρησης εφαρμογής είναι το καθένα σύνθετο αυτό καθαυτό Επιπλέον οι σχετιζόμενες περιοχές της ανωνυμοποίησης και ασφάλειας περιέχουν πολλά προσθέτα θέματα Παρόλα αυτά υπάρχουν περισσότερα στη

1011

Διαδικτυακή μέτρηση που μπορούν να προβλεφθούν στο κοντινό μέλλον Πολλά από αυτά τα θέματα αρχίζουν να μελετώνται αλλά δεν είναι ακόμη αναπτυγμένα ή αρκετά ώριμα για να καλυφθούν σε αυτό το βιβλίο

Η περιοχή των μετρήσεων ασυρμάτου Διαδικτύου είναι μια σημαντική αναδυόμενη περιοχή Από τη μία πλευρά η μετάδοση ασυρμάτων δεδομένων έχει χρησιμοποιηθεί στο Διαδίκτυο από τις πρώτες του μέρες ως το ARPANET Όμως στα πρώτα πειράματα του ARPANET ασύρματοι σύνδεσμοι χρησιμοποιήθηκαν για συνδέσεις δικτύου κορμού σε μακρινές τοποθεσίες συνήθως μέσω δορυφόρου Σε αντίθεση η σημασία των ασυρμάτων συνδέσμων έχει αυξηθεί δραματικά πιο πρόσφατα με την εισαγωγή της τεχνολογίας ασυρμάτων LAN Οι πιο αξιοσημείωτοι από αυτούς είναι τα πρωτόκολλα που βασίζονται στο σύνολο προτύπων IEEE 80211 (πχ WiFi)

Η φύση της ασύρματης μέτρησης είναι μάλλον διαφορετική από τη μέτρηση του ενσύρματου Διαδικτύου Η ασύρματη μέτρηση βασίζεται στη σύλληψη μετάδοσης ραδιοκυμάτων Αυτό σημαίνει ότι η ακριβής ασύρματη μέτρηση και η σωστή μετάφραση αυτών των μετρήσεων περιλαμβάνει νέα θέματα και περιορισμούς Σαν αποτέλεσμα το πεδίο της ασύρματης Διαδικτυακής μέτρησης είναι ακόμη σε υπό διαμόρφωσιν στάδια σχετικά λίγες καθοριστικές μελέτες έχουν διεξαχθεί ως τώρα

Μια άλλη αναδυόμενη περιοχή είναι τα δίκτυα αισθητήρα Αυτά είναι δίκτυα συσκευών χαμηλής ισχύος που αναμένεται να σχηματίσουν δίκτυα χωρίς σημαντική υποδομιακή υποστήριξη Υπάρχουν σημαντικά θέματα μέτρησης σχετιζόμενα με αυτά τα δίκτυα Όμως το πεδίο είναι ακόμη νεότερο από αυτό της ασυρμάτου δικτύωσης γενικά και η εργασία δεν είναι ακόμη ώριμη σε αυτήν την περιοχή

Γυρίζοντας στο ενσύρματο Διαδίκτυο ένα θέμα που δεν έχει ακόμη μελετηθεί σε βάθος είναι μετρήσεις δικτύων και κυκλοφορίας IPv6 Ενώ το πρωτόκολλο IPv6 έχει λειτουργήσει για ένα αριθμό ετών η υιοθέτηση του δεν είναι ακόμη ευρέως διαδεδομένη Σε πολλά σημεία η συμπεριφορά του IPv6 διαφέρει από το IPv4 σε μόνο λίγα σημεία αναφορικά με τις μετρήσεις έτσι δεν έχουμε εστιάσει στο IPv6 σε μεγάλο βαθμό στο βιβλίο Όμως καθώς το IPv6 γίνεται πιο ευρέως διαδεδομένο είναι πιθανό ότι νέα θέματα μέτρησης θα προκύψουν

Επιπρόσθετα όπως σημειώθηκε παραπάνω η σουίτα των εφαρμογών που χρησιμοποιούνται στο Διαδίκτυο είναι σε μια συνεχή ρευστότητα Ενώ μπορούμε να αναγνωρίσουμε γενικά μετατοπίσεις στους κυρίαρχους τύπους εφαρμογών πχ από τον Ιστό στο P2P υπάρχουν επίσης σημαντικές δευτερεύουσες μετατοπίσεις Για παράδειγμα εντός του συνόλου εφαρμογής P2P πρώιμες εφαρμογές όπως το KaZaa έχουν παραχωρήσει προτεραιότητα σε πιο πρόσφατες παραλλαγές όπως το BitTorrent Αυτές οι εφαρμογές είναι αρκετά διαφορετικές σε πολλά σημεία και αυτές οι μετατοπίσεις από μια κυρίαρχη εφαρμογή σε μια άλλη έχουν ένα σημαντικό αποτέλεσμα στη φύση της κυκλοφορίας Κοιτάζοντας στο μέλλον δικτυωμένα παιχνίδια έχουν το δυναμικό να γίνουν μια κυρίαρχη εφαρμογή (τουλάχιστον υπό όρους χρηστών αν όχι υπό όρους συνολικής κυκλοφορίας) Έχουμε προσπαθήσει να δώσουμε έμφαση στα μακροχρόνια αποτελέσματα στην περιοχή των Διαδικτυακών εφαρμογών Όμως καθώς νέες εφαρμογές αναδύονται θα υπάρξει μια φυσική μετατόπιση στην εστίαση της προσοχής μέτρησης

Τελικά έχουμε σημειώσει ότι υπάρχει σημαντικό ενδιαφέρον σε στατιστικά μοντέλα φυσικής για ιδιότητες Διαδικτύου Αυτή είναι μια περιοχή έρευνας που συχνά γεφυρώνει επιπλέον θέματα στη βιοπληροφορική κοινωνιολογία και μηχανική Δεν είχαμε το χώρο να καλύψουμε αυτό το ευρύτερο σύνολο θεμάτων Όμως έχουμε δώσει μια επισκόπηση των συνεισφορών της στατιστικής φυσικής μέχρι σήμερα στη Διαδικτυακή μοντελοποίηση και έχουμε δώσει αναφορές σε αυτήν την ερευνητική βιβλιογραφία όπου είναι σχετικό Δραστηριότητα σε αυτήν την περιοχή πιθανό να συνεχίσει και αυξηθεί στο κοντινό μέλλον

1111

Πιο Μακροπρόθεσμα Μια από τις πιο ανοικτού τέλους μελλοντικές κατευθύνσεις αφορά το τι και πώς νέα ερωτήματα θα αναδυθούν στη Διαδικτυακή μέτρηση Έχουμε δει ότι τα είδη των ερωτημάτων που διευθετήθηκαν στη Διαδικτυακή μέτρηση έχουν εξελιχθεί με το χρόνο σε πολλές περιπτώσεις η ανάδυση νέων ερωτημάτων ήταν δύσκολο να προβλεφθεί

Για παράδειγμα η έκρηξη του Παγκοσμίου Ιστού από τις αρχές ως τα μέσα της δεκαετίας του 1990 προκάλεσαν ένα τεράστιο ποσό έρευνας Από τη μια πλευρά αυτή η έρευνα ήταν κυρίως κατευθυνόμενη από τη δημοτικότητα του Ιστού ndash για παράδειγμα ένας αριθμός κατανεμημένων πληροφοριακών συστημάτων προϋπήρξε του Ιστού αλλά αυτά δεν υπόκειντο σε σημαντική προσοχή μέτρησης Από την άλλη πλευρά αυτή η έρευνα επέδειξε έναν αριθμό αποτελεσμάτων που μπορεί να θεωρηθούν θεμελιώδη όπως η παρουσία υψηλής μεταβλητότητας στα μεγέθη και τη δημοτικότητα των αντικειμένων Ιστού

Αυτό το παράδειγμα δείχνει ότι κάποια πιο μακροπρόθεσμα αναδυόμενα ερωτήματα μπορεί να κατευθυνθούν από νέες laquoεφαρμογές φονείςraquo ή από νέους τρόπους χρήσης του Διαδικτύου Αυτά είναι εξ ορισμού δύσκολο να προβλεφθούν

Ένα άλλο σύνολο πιο μακροπρόθεσμων ερωτημάτων αφορά την αυξανόμενη ενσωμάτωση του Διαδικτύου στην κοινωνία Ως τέτοια νέα ερωτήματα μέτρησης θα προκύψουν αναμφισβήτητα σε σχέση με την ανθρώπινη δραστηριότητα Για παράδειγμα καθώς η χρήση του Διαδικτύου έχει αυξηθεί στο εμπόριο υπάρχει αυξανόμενη σπουδαιότητα στην κατανόηση κακόβουλης δραστηριότητας τη μέτρηση γεωγραφικής τοποθεσίας και τη διερεύνηση της σχέσης μεταξύ της οικονομικής ανάπτυξης και της Διαδικτυακής υποδομής Αυτά τα ερωτήματα αρχίζουν να διευθετούνται μέσω εργασίας στην ασφάλεια την ανωνυμοποίηση και άλλα πεδία αλλά υπάρχουν αναμφίβολα πολλά σημαντικά ερωτήματα ακόμη να αναδυθούν

Βιβλιογραφία

Crovella M Krishnamurthy B 2006 Internet Measurement Infrastructure Traffic and Applications John Wiley amp Sons Inc 2006

ΤΕΛΟΣ ΚΑΙ Τῼ ΘΕῼ ΔΟΞΑ

  • 111 Τάσεις στη Διαδικτυακή Μέτρηση
  • 112 Δυσκολίες
  • 113 Μελλοντική Εργασία
    • 1131 Ερευνητικές Προκλήσεις
    • 1132 Αναδυόμενα Ερωτήματα
      • Βιβλιογραφία
Page 8: Μετάφραση τοῦ κεφαλαίου 11 τοῦ βιβλίου «Internet Measurement: Infrastructure, Traffic and Applications» [Translation of chapter 11 of the book «Internet

811

εφαρμόζουν επαναμετάδοση ή διόρθωση εμπροσθίου σφάλματος αποκρύπτοντας τη φθορά πακέτου στο φυσικό επίπεδο Η μέτρηση στο επίπεδο πακέτου (IP) γενικά δεν περιλαμβάνει πληροφορίες σχετικά με λεπτομέρειες όπως αυτές σε χαμηλότερα επίπεδα

Τελικά το γεγονός ότι το Διαδίκτυο έχει μια αποκεντρωμένη οργάνωση σε πολλά επίπεδα σημαίνει ότι δεν υπάρχει πραγματικά κεντρική τοποθεσία στο δίκτυο για σκοπούς παρακολούθησης Για παράδειγμα υπάρχουν πολλά αυτόνομα συστήματα ανωτάτου επιπέδου στο Διαδίκτυο και ένα πακέτο μπορεί να ρεύσει μέσω οποιουδήποτε (ή κανενός) από αυτά Επιπλέον τα αυτόνομα συστήματα ανωτάτου επιπέδου γενικά συνδέονται μεταξύ τους σε πολλαπλές τοποθεσίες Αυτή η πλεγματοειδής δομή σημαίνει ότι μετρήσεις που γίνονται σε κάθε μονό σημείο αναπόφευκτα χάνουν ένα μεγάλο κλάσμα κυκλοφορίας δικτύου

Διαχειριστικά θέματα Όπως είδαμε το Διαδίκτυο είναι ένα δίκτυο δικτύων τα συστατικά δίκτυα κατέχονται και λειτουργούνται από ανεξάρτητες οντότητες ndash τους Παρόχους Υπηρεσιών Δικτύου (ISP) Πολλοί ISP είναι κερδοσκοπικές οντότητες σε ανταγωνισμό μεταξύ τους

Σαν αποτέλεσμα οι ISP αντιστέκονται στη διάθεση σημαντικής πληροφορίας εκτός του οργανισμού τους επειδή αυτή η πληροφορία μπορεί να χρησιμοποιηθεί από τον ανταγωνιστή τους Για παράδειγμα οι ISP γενικά δε δημοσιεύουν πόση κυκλοφορία μεταφέρουν τα δίκτυά τους ή το μέγεθος ή την ακριβή φυσική διάταξη των δικτύων τους ή τη σύνθεση της κυκλοφορίας τους (όπως το μίγμα εφαρμογής ή η διάδοση κακόβουλης κυκλοφορίας)

Η έλλειψη εξωτερικής πληροφορίας σχετικά με ξεχωριστά λειτουργούμενα δίκτυα εμποδίζει πολλούς αξιέπαινους σκοπούς Για παράδειγμα αυτή η μυστικότητα εξασθενεί την ικανότητά μας να ανιχνεύσουμε ξεσπάσματα λογισμικού σκουληκιού (worm) ανά το δίκτυο ή να κατανοήσουμε το ρυθμό αύξησης της δικτυακής κυκλοφορίας παγκοσμίως

113 Μελλοντική Εργασία

Οι δυσκολίες που συγκαταριθμήθηκαν στην τελευταία ενότητα παρέχουν ένα πλαίσιο για την κατανόηση του πώς η μελλοντική Διαδικτυακή μέτρηση θα περιοριστεί και προκληθεί Σε αυτήν την ενότητα ρίχνουμε μια ματιά στις τάσεις μέτρησης που μπορούν να προβλεφθούν στο μέλλον

1131 Ερευνητικές Προκλήσεις Η προσπάθεια να αυξηθεί η Διαδικτυακή κατανόησή μας οδηγεί σε έναν αριθμό

ερευνητικών προκλήσεων Αυτές αντιπροσωπεύουν ερωτήματα σχετικά με το πώς η Διαδικτυακή μέτρηση θα έπρεπε να διεξαχθεί στο μέλλον

Πλατφόρμες Μέτρησης Σε προηγούμενες ενότητες έχουμε δει ότι υπάρχουν πολλές ανικανοποίητες προκλήσεις στη μέτρηση του Διαδικτύου από την άλλη πλευρά η δραστηριότητα στη Διαδικτυακή μέτρηση έχει αυξηθεί δραματικά στα τελευταία χρόνια Αυτά τα δύο γεγονότα δείχνουν ότι φαίνεται αξιόλογο να ανατεθεί αυξημένη προσπάθεια στην κατασκευή πλατφορμών και υποδομής για Διαδικτυακή μέτρηση

Τα έργα που συζητήθηκαν στο Κεφάλαιο 10 δείχνουν ότι ένα φάσμα αρχιτεκτονικών επιλογών είναι δυνατό στην κατασκευή πλατφορμών μέτρησης [EMG] Αυτές οι επιλογές επηρεάζουν τη χρησιμότητα και την μακροπρόθεσμη επιτυχία των προσπαθειών μέτρησης που χρησιμοποιούν αυτές οι πλατφόρμες Κάποιες από τις θεωρήσεις είναι

bull Ποιος θα έπρεπε να χρηματοδοτήσει την υποδομή μέτρησης για το Διαδίκτυο Και κυβερνητικές και εμπορικές προσεγγίσεις είναι δυνατές

bull Θα έπρεπε μια υποδομή μέτρησης να ελεγχθεί από ένα μόνο οργανισμό ή θα έπρεπε ο έλεγχός του να μοιράζεται από πολλαπλούς διερευνητές ή ομάδες

911

bull Πώς θα έπρεπε να χρησιμοποιηθούν τα συστήματα μέτρησης Πώς θα έπρεπε να ληφθούν αποφάσεις αναφορικά με τη σχετική έμφαση σε διαφορετικούς σκοπούς για μια πλατφόρμα μέτρησης

bull Θα έπρεπε να κατασκευαστούν εξειδικευμένες πλατφόρμες μέτρησης ίσως για συγκεκριμένες κοινότητες χρηστών ή για την απάντηση συγκεκριμένων ζητημάτων Αν μια πλατφόρμα πρέπει να είναι γενικής χρήσης τι μορφή θα έπρεπε να πάρει

Η κατασκευή πλατφορμών μέτρησης ευρείας κλίμακας έχει το δυναμικό να κάνει πρόοδο σε θεμελιώδη ανοιχτά ερωτήματα αναφορικά με το Διαδίκτυο Για παράδειγμα η παγκόσμια τοπολογία του Διαδικτύου είναι ανεπαρκώς γνωστή και θα μπορούσε να ερευνηθεί πληρέστερα η φύση και διάδοση κακόβουλης δραστηριότητας στο Διαδίκτυο θα μπορούσε να εκτιμηθεί ακριβέστερα και ο βαθμός στον οποίο η κυκλοφορία αυξάνει και αλλάζει στο Διαδίκτυο θα μπορούσε να κατανοηθεί καλύτερα

Αποτελέσματα Διαμοιραζόμενης Μέτρησης Επίσης σημειώνουμε ότι ένω η απόκτηση Διαδικτυακών μετρήσεων μπορεί να απαιτεί σημαντική προσπάθεια σε πολλές περιπτώσεις μετρήσεις χρησιμοποιούνται μόνο για μια μόνη μελέτη η μόνο από τον οργανισμό που κάνει τις μετρήσεις

Αυτό δείχνει ότι περισσότερη εργασία θα έπρεπε να γίνει για να ξεπεραστούν οι φραγμοί στο συχνό διαμοιρασμό των μετρήσεων ή σχετιζομένων δεδομένων Αυτοί οι φραγμοί περιλαμβάνουν

bull Οι οργανισμοί μπορεί να έχουν μονοπωλιακό ενδιαφέρον σε κάποια είδη δεδομένων που ελέγχουν αλλά όχι σε άλλα Υπάρχει μια ανάγκη για μεθόδους για να γίνουν διαθέσιμες οι μετρήσεις με τρόπους που δεν απελευθερώνουν εμπορικά ευαίσθητη πληροφορία

bull Είναι συχνά μάλλον δύσκολο να τεθούν σύνολα δεδομένων μέτρησης σε μια μορφή που άλλα μπορούν να χρησιμοποιήσουν Είναι σημαντικό να κατανοηθεί και τεκμηριωθεί το πώς έγιναν οι μετρήσεις η ποιότητα των δεδομένων (συμπεριλαμβανομένης της σημείωσης του ποιά σημεία δεδομένων είναι εσφαλμένα) η μορφή των δεδομένων και οι υποθέσεις που υπόκεινται της συλλογής δεδομένων Αυτή η προσπάθεια παίρνει χρόνο

bull Η αποθήκευση και η κατανομή μεγάλων συνόλων δεδομένων μπορεί να απαιτεί σημαντκούς πόρους συμπεριλαμβανομένων του χώρου δίσκου και της χωρητικότητας δικτύου Αυτοί οι πόροι είναι ακριβοί και η χρήση τους πρέπει να δικαιολογηθεί

Η έρευνα σε αυτήν την περιοχή είναι σημαντική επειδή ο διαμοιρασμός μετρήσεων έχει πολλές ωφέλειες Σημαίνει ότι η προσπάθεια στην απόκτηση μετρήσεων ξεπληρώνεται με πολλαπλές χρήσεις Επιτρέπει τα ερευνητικά αποτελέσματα που βασίζονται στην ανάλυση των δεδομένων να επαληθευτούν ανεξάρτητα Και επιτρέπει νέα ερωτήματα να ερωτηθούν ερωτήματα που μπορεί να μην ήταν η βάση για την πρωτότυπη προσπάθεια μέτρησης

1132 Αναδυόμενα Ερωτήματα Ολοκληρώνοντας το βιβλίο είναι φυσικό να ερωτούμε ποια είναι τα επόμενα βήματα στη

Διαδικτυακή μέτρηση Πού πηγαίνει το πεδίο και ποια αναδυόμενα ερωτήματα μπορούν να προβλεφθούν Βεβαίως είναι αδύνατο να απαντηθούν πλήρως αυτές οι ερωτήσεις αλλά σε αυτήν την ενότητα προτείνουμε κάποιες μερικές απαντήσεις Χωρίζουμε τα θέματα σε βραχυπρόθεσμα και πιο μακροπρόθεσμα ερωτήματα μέτρησης

Βραχυπρόθεσμα Αυτό το βιβλίο έχει καλύψει ένα ευρύ φάσμα θεμάτων στη Διαδικτυακή μέτρηση Τα υποπεδία της υποδομής κυκλοφορίας και μέτρησης εφαρμογής είναι το καθένα σύνθετο αυτό καθαυτό Επιπλέον οι σχετιζόμενες περιοχές της ανωνυμοποίησης και ασφάλειας περιέχουν πολλά προσθέτα θέματα Παρόλα αυτά υπάρχουν περισσότερα στη

1011

Διαδικτυακή μέτρηση που μπορούν να προβλεφθούν στο κοντινό μέλλον Πολλά από αυτά τα θέματα αρχίζουν να μελετώνται αλλά δεν είναι ακόμη αναπτυγμένα ή αρκετά ώριμα για να καλυφθούν σε αυτό το βιβλίο

Η περιοχή των μετρήσεων ασυρμάτου Διαδικτύου είναι μια σημαντική αναδυόμενη περιοχή Από τη μία πλευρά η μετάδοση ασυρμάτων δεδομένων έχει χρησιμοποιηθεί στο Διαδίκτυο από τις πρώτες του μέρες ως το ARPANET Όμως στα πρώτα πειράματα του ARPANET ασύρματοι σύνδεσμοι χρησιμοποιήθηκαν για συνδέσεις δικτύου κορμού σε μακρινές τοποθεσίες συνήθως μέσω δορυφόρου Σε αντίθεση η σημασία των ασυρμάτων συνδέσμων έχει αυξηθεί δραματικά πιο πρόσφατα με την εισαγωγή της τεχνολογίας ασυρμάτων LAN Οι πιο αξιοσημείωτοι από αυτούς είναι τα πρωτόκολλα που βασίζονται στο σύνολο προτύπων IEEE 80211 (πχ WiFi)

Η φύση της ασύρματης μέτρησης είναι μάλλον διαφορετική από τη μέτρηση του ενσύρματου Διαδικτύου Η ασύρματη μέτρηση βασίζεται στη σύλληψη μετάδοσης ραδιοκυμάτων Αυτό σημαίνει ότι η ακριβής ασύρματη μέτρηση και η σωστή μετάφραση αυτών των μετρήσεων περιλαμβάνει νέα θέματα και περιορισμούς Σαν αποτέλεσμα το πεδίο της ασύρματης Διαδικτυακής μέτρησης είναι ακόμη σε υπό διαμόρφωσιν στάδια σχετικά λίγες καθοριστικές μελέτες έχουν διεξαχθεί ως τώρα

Μια άλλη αναδυόμενη περιοχή είναι τα δίκτυα αισθητήρα Αυτά είναι δίκτυα συσκευών χαμηλής ισχύος που αναμένεται να σχηματίσουν δίκτυα χωρίς σημαντική υποδομιακή υποστήριξη Υπάρχουν σημαντικά θέματα μέτρησης σχετιζόμενα με αυτά τα δίκτυα Όμως το πεδίο είναι ακόμη νεότερο από αυτό της ασυρμάτου δικτύωσης γενικά και η εργασία δεν είναι ακόμη ώριμη σε αυτήν την περιοχή

Γυρίζοντας στο ενσύρματο Διαδίκτυο ένα θέμα που δεν έχει ακόμη μελετηθεί σε βάθος είναι μετρήσεις δικτύων και κυκλοφορίας IPv6 Ενώ το πρωτόκολλο IPv6 έχει λειτουργήσει για ένα αριθμό ετών η υιοθέτηση του δεν είναι ακόμη ευρέως διαδεδομένη Σε πολλά σημεία η συμπεριφορά του IPv6 διαφέρει από το IPv4 σε μόνο λίγα σημεία αναφορικά με τις μετρήσεις έτσι δεν έχουμε εστιάσει στο IPv6 σε μεγάλο βαθμό στο βιβλίο Όμως καθώς το IPv6 γίνεται πιο ευρέως διαδεδομένο είναι πιθανό ότι νέα θέματα μέτρησης θα προκύψουν

Επιπρόσθετα όπως σημειώθηκε παραπάνω η σουίτα των εφαρμογών που χρησιμοποιούνται στο Διαδίκτυο είναι σε μια συνεχή ρευστότητα Ενώ μπορούμε να αναγνωρίσουμε γενικά μετατοπίσεις στους κυρίαρχους τύπους εφαρμογών πχ από τον Ιστό στο P2P υπάρχουν επίσης σημαντικές δευτερεύουσες μετατοπίσεις Για παράδειγμα εντός του συνόλου εφαρμογής P2P πρώιμες εφαρμογές όπως το KaZaa έχουν παραχωρήσει προτεραιότητα σε πιο πρόσφατες παραλλαγές όπως το BitTorrent Αυτές οι εφαρμογές είναι αρκετά διαφορετικές σε πολλά σημεία και αυτές οι μετατοπίσεις από μια κυρίαρχη εφαρμογή σε μια άλλη έχουν ένα σημαντικό αποτέλεσμα στη φύση της κυκλοφορίας Κοιτάζοντας στο μέλλον δικτυωμένα παιχνίδια έχουν το δυναμικό να γίνουν μια κυρίαρχη εφαρμογή (τουλάχιστον υπό όρους χρηστών αν όχι υπό όρους συνολικής κυκλοφορίας) Έχουμε προσπαθήσει να δώσουμε έμφαση στα μακροχρόνια αποτελέσματα στην περιοχή των Διαδικτυακών εφαρμογών Όμως καθώς νέες εφαρμογές αναδύονται θα υπάρξει μια φυσική μετατόπιση στην εστίαση της προσοχής μέτρησης

Τελικά έχουμε σημειώσει ότι υπάρχει σημαντικό ενδιαφέρον σε στατιστικά μοντέλα φυσικής για ιδιότητες Διαδικτύου Αυτή είναι μια περιοχή έρευνας που συχνά γεφυρώνει επιπλέον θέματα στη βιοπληροφορική κοινωνιολογία και μηχανική Δεν είχαμε το χώρο να καλύψουμε αυτό το ευρύτερο σύνολο θεμάτων Όμως έχουμε δώσει μια επισκόπηση των συνεισφορών της στατιστικής φυσικής μέχρι σήμερα στη Διαδικτυακή μοντελοποίηση και έχουμε δώσει αναφορές σε αυτήν την ερευνητική βιβλιογραφία όπου είναι σχετικό Δραστηριότητα σε αυτήν την περιοχή πιθανό να συνεχίσει και αυξηθεί στο κοντινό μέλλον

1111

Πιο Μακροπρόθεσμα Μια από τις πιο ανοικτού τέλους μελλοντικές κατευθύνσεις αφορά το τι και πώς νέα ερωτήματα θα αναδυθούν στη Διαδικτυακή μέτρηση Έχουμε δει ότι τα είδη των ερωτημάτων που διευθετήθηκαν στη Διαδικτυακή μέτρηση έχουν εξελιχθεί με το χρόνο σε πολλές περιπτώσεις η ανάδυση νέων ερωτημάτων ήταν δύσκολο να προβλεφθεί

Για παράδειγμα η έκρηξη του Παγκοσμίου Ιστού από τις αρχές ως τα μέσα της δεκαετίας του 1990 προκάλεσαν ένα τεράστιο ποσό έρευνας Από τη μια πλευρά αυτή η έρευνα ήταν κυρίως κατευθυνόμενη από τη δημοτικότητα του Ιστού ndash για παράδειγμα ένας αριθμός κατανεμημένων πληροφοριακών συστημάτων προϋπήρξε του Ιστού αλλά αυτά δεν υπόκειντο σε σημαντική προσοχή μέτρησης Από την άλλη πλευρά αυτή η έρευνα επέδειξε έναν αριθμό αποτελεσμάτων που μπορεί να θεωρηθούν θεμελιώδη όπως η παρουσία υψηλής μεταβλητότητας στα μεγέθη και τη δημοτικότητα των αντικειμένων Ιστού

Αυτό το παράδειγμα δείχνει ότι κάποια πιο μακροπρόθεσμα αναδυόμενα ερωτήματα μπορεί να κατευθυνθούν από νέες laquoεφαρμογές φονείςraquo ή από νέους τρόπους χρήσης του Διαδικτύου Αυτά είναι εξ ορισμού δύσκολο να προβλεφθούν

Ένα άλλο σύνολο πιο μακροπρόθεσμων ερωτημάτων αφορά την αυξανόμενη ενσωμάτωση του Διαδικτύου στην κοινωνία Ως τέτοια νέα ερωτήματα μέτρησης θα προκύψουν αναμφισβήτητα σε σχέση με την ανθρώπινη δραστηριότητα Για παράδειγμα καθώς η χρήση του Διαδικτύου έχει αυξηθεί στο εμπόριο υπάρχει αυξανόμενη σπουδαιότητα στην κατανόηση κακόβουλης δραστηριότητας τη μέτρηση γεωγραφικής τοποθεσίας και τη διερεύνηση της σχέσης μεταξύ της οικονομικής ανάπτυξης και της Διαδικτυακής υποδομής Αυτά τα ερωτήματα αρχίζουν να διευθετούνται μέσω εργασίας στην ασφάλεια την ανωνυμοποίηση και άλλα πεδία αλλά υπάρχουν αναμφίβολα πολλά σημαντικά ερωτήματα ακόμη να αναδυθούν

Βιβλιογραφία

Crovella M Krishnamurthy B 2006 Internet Measurement Infrastructure Traffic and Applications John Wiley amp Sons Inc 2006

ΤΕΛΟΣ ΚΑΙ Τῼ ΘΕῼ ΔΟΞΑ

  • 111 Τάσεις στη Διαδικτυακή Μέτρηση
  • 112 Δυσκολίες
  • 113 Μελλοντική Εργασία
    • 1131 Ερευνητικές Προκλήσεις
    • 1132 Αναδυόμενα Ερωτήματα
      • Βιβλιογραφία
Page 9: Μετάφραση τοῦ κεφαλαίου 11 τοῦ βιβλίου «Internet Measurement: Infrastructure, Traffic and Applications» [Translation of chapter 11 of the book «Internet

911

bull Πώς θα έπρεπε να χρησιμοποιηθούν τα συστήματα μέτρησης Πώς θα έπρεπε να ληφθούν αποφάσεις αναφορικά με τη σχετική έμφαση σε διαφορετικούς σκοπούς για μια πλατφόρμα μέτρησης

bull Θα έπρεπε να κατασκευαστούν εξειδικευμένες πλατφόρμες μέτρησης ίσως για συγκεκριμένες κοινότητες χρηστών ή για την απάντηση συγκεκριμένων ζητημάτων Αν μια πλατφόρμα πρέπει να είναι γενικής χρήσης τι μορφή θα έπρεπε να πάρει

Η κατασκευή πλατφορμών μέτρησης ευρείας κλίμακας έχει το δυναμικό να κάνει πρόοδο σε θεμελιώδη ανοιχτά ερωτήματα αναφορικά με το Διαδίκτυο Για παράδειγμα η παγκόσμια τοπολογία του Διαδικτύου είναι ανεπαρκώς γνωστή και θα μπορούσε να ερευνηθεί πληρέστερα η φύση και διάδοση κακόβουλης δραστηριότητας στο Διαδίκτυο θα μπορούσε να εκτιμηθεί ακριβέστερα και ο βαθμός στον οποίο η κυκλοφορία αυξάνει και αλλάζει στο Διαδίκτυο θα μπορούσε να κατανοηθεί καλύτερα

Αποτελέσματα Διαμοιραζόμενης Μέτρησης Επίσης σημειώνουμε ότι ένω η απόκτηση Διαδικτυακών μετρήσεων μπορεί να απαιτεί σημαντική προσπάθεια σε πολλές περιπτώσεις μετρήσεις χρησιμοποιούνται μόνο για μια μόνη μελέτη η μόνο από τον οργανισμό που κάνει τις μετρήσεις

Αυτό δείχνει ότι περισσότερη εργασία θα έπρεπε να γίνει για να ξεπεραστούν οι φραγμοί στο συχνό διαμοιρασμό των μετρήσεων ή σχετιζομένων δεδομένων Αυτοί οι φραγμοί περιλαμβάνουν

bull Οι οργανισμοί μπορεί να έχουν μονοπωλιακό ενδιαφέρον σε κάποια είδη δεδομένων που ελέγχουν αλλά όχι σε άλλα Υπάρχει μια ανάγκη για μεθόδους για να γίνουν διαθέσιμες οι μετρήσεις με τρόπους που δεν απελευθερώνουν εμπορικά ευαίσθητη πληροφορία

bull Είναι συχνά μάλλον δύσκολο να τεθούν σύνολα δεδομένων μέτρησης σε μια μορφή που άλλα μπορούν να χρησιμοποιήσουν Είναι σημαντικό να κατανοηθεί και τεκμηριωθεί το πώς έγιναν οι μετρήσεις η ποιότητα των δεδομένων (συμπεριλαμβανομένης της σημείωσης του ποιά σημεία δεδομένων είναι εσφαλμένα) η μορφή των δεδομένων και οι υποθέσεις που υπόκεινται της συλλογής δεδομένων Αυτή η προσπάθεια παίρνει χρόνο

bull Η αποθήκευση και η κατανομή μεγάλων συνόλων δεδομένων μπορεί να απαιτεί σημαντκούς πόρους συμπεριλαμβανομένων του χώρου δίσκου και της χωρητικότητας δικτύου Αυτοί οι πόροι είναι ακριβοί και η χρήση τους πρέπει να δικαιολογηθεί

Η έρευνα σε αυτήν την περιοχή είναι σημαντική επειδή ο διαμοιρασμός μετρήσεων έχει πολλές ωφέλειες Σημαίνει ότι η προσπάθεια στην απόκτηση μετρήσεων ξεπληρώνεται με πολλαπλές χρήσεις Επιτρέπει τα ερευνητικά αποτελέσματα που βασίζονται στην ανάλυση των δεδομένων να επαληθευτούν ανεξάρτητα Και επιτρέπει νέα ερωτήματα να ερωτηθούν ερωτήματα που μπορεί να μην ήταν η βάση για την πρωτότυπη προσπάθεια μέτρησης

1132 Αναδυόμενα Ερωτήματα Ολοκληρώνοντας το βιβλίο είναι φυσικό να ερωτούμε ποια είναι τα επόμενα βήματα στη

Διαδικτυακή μέτρηση Πού πηγαίνει το πεδίο και ποια αναδυόμενα ερωτήματα μπορούν να προβλεφθούν Βεβαίως είναι αδύνατο να απαντηθούν πλήρως αυτές οι ερωτήσεις αλλά σε αυτήν την ενότητα προτείνουμε κάποιες μερικές απαντήσεις Χωρίζουμε τα θέματα σε βραχυπρόθεσμα και πιο μακροπρόθεσμα ερωτήματα μέτρησης

Βραχυπρόθεσμα Αυτό το βιβλίο έχει καλύψει ένα ευρύ φάσμα θεμάτων στη Διαδικτυακή μέτρηση Τα υποπεδία της υποδομής κυκλοφορίας και μέτρησης εφαρμογής είναι το καθένα σύνθετο αυτό καθαυτό Επιπλέον οι σχετιζόμενες περιοχές της ανωνυμοποίησης και ασφάλειας περιέχουν πολλά προσθέτα θέματα Παρόλα αυτά υπάρχουν περισσότερα στη

1011

Διαδικτυακή μέτρηση που μπορούν να προβλεφθούν στο κοντινό μέλλον Πολλά από αυτά τα θέματα αρχίζουν να μελετώνται αλλά δεν είναι ακόμη αναπτυγμένα ή αρκετά ώριμα για να καλυφθούν σε αυτό το βιβλίο

Η περιοχή των μετρήσεων ασυρμάτου Διαδικτύου είναι μια σημαντική αναδυόμενη περιοχή Από τη μία πλευρά η μετάδοση ασυρμάτων δεδομένων έχει χρησιμοποιηθεί στο Διαδίκτυο από τις πρώτες του μέρες ως το ARPANET Όμως στα πρώτα πειράματα του ARPANET ασύρματοι σύνδεσμοι χρησιμοποιήθηκαν για συνδέσεις δικτύου κορμού σε μακρινές τοποθεσίες συνήθως μέσω δορυφόρου Σε αντίθεση η σημασία των ασυρμάτων συνδέσμων έχει αυξηθεί δραματικά πιο πρόσφατα με την εισαγωγή της τεχνολογίας ασυρμάτων LAN Οι πιο αξιοσημείωτοι από αυτούς είναι τα πρωτόκολλα που βασίζονται στο σύνολο προτύπων IEEE 80211 (πχ WiFi)

Η φύση της ασύρματης μέτρησης είναι μάλλον διαφορετική από τη μέτρηση του ενσύρματου Διαδικτύου Η ασύρματη μέτρηση βασίζεται στη σύλληψη μετάδοσης ραδιοκυμάτων Αυτό σημαίνει ότι η ακριβής ασύρματη μέτρηση και η σωστή μετάφραση αυτών των μετρήσεων περιλαμβάνει νέα θέματα και περιορισμούς Σαν αποτέλεσμα το πεδίο της ασύρματης Διαδικτυακής μέτρησης είναι ακόμη σε υπό διαμόρφωσιν στάδια σχετικά λίγες καθοριστικές μελέτες έχουν διεξαχθεί ως τώρα

Μια άλλη αναδυόμενη περιοχή είναι τα δίκτυα αισθητήρα Αυτά είναι δίκτυα συσκευών χαμηλής ισχύος που αναμένεται να σχηματίσουν δίκτυα χωρίς σημαντική υποδομιακή υποστήριξη Υπάρχουν σημαντικά θέματα μέτρησης σχετιζόμενα με αυτά τα δίκτυα Όμως το πεδίο είναι ακόμη νεότερο από αυτό της ασυρμάτου δικτύωσης γενικά και η εργασία δεν είναι ακόμη ώριμη σε αυτήν την περιοχή

Γυρίζοντας στο ενσύρματο Διαδίκτυο ένα θέμα που δεν έχει ακόμη μελετηθεί σε βάθος είναι μετρήσεις δικτύων και κυκλοφορίας IPv6 Ενώ το πρωτόκολλο IPv6 έχει λειτουργήσει για ένα αριθμό ετών η υιοθέτηση του δεν είναι ακόμη ευρέως διαδεδομένη Σε πολλά σημεία η συμπεριφορά του IPv6 διαφέρει από το IPv4 σε μόνο λίγα σημεία αναφορικά με τις μετρήσεις έτσι δεν έχουμε εστιάσει στο IPv6 σε μεγάλο βαθμό στο βιβλίο Όμως καθώς το IPv6 γίνεται πιο ευρέως διαδεδομένο είναι πιθανό ότι νέα θέματα μέτρησης θα προκύψουν

Επιπρόσθετα όπως σημειώθηκε παραπάνω η σουίτα των εφαρμογών που χρησιμοποιούνται στο Διαδίκτυο είναι σε μια συνεχή ρευστότητα Ενώ μπορούμε να αναγνωρίσουμε γενικά μετατοπίσεις στους κυρίαρχους τύπους εφαρμογών πχ από τον Ιστό στο P2P υπάρχουν επίσης σημαντικές δευτερεύουσες μετατοπίσεις Για παράδειγμα εντός του συνόλου εφαρμογής P2P πρώιμες εφαρμογές όπως το KaZaa έχουν παραχωρήσει προτεραιότητα σε πιο πρόσφατες παραλλαγές όπως το BitTorrent Αυτές οι εφαρμογές είναι αρκετά διαφορετικές σε πολλά σημεία και αυτές οι μετατοπίσεις από μια κυρίαρχη εφαρμογή σε μια άλλη έχουν ένα σημαντικό αποτέλεσμα στη φύση της κυκλοφορίας Κοιτάζοντας στο μέλλον δικτυωμένα παιχνίδια έχουν το δυναμικό να γίνουν μια κυρίαρχη εφαρμογή (τουλάχιστον υπό όρους χρηστών αν όχι υπό όρους συνολικής κυκλοφορίας) Έχουμε προσπαθήσει να δώσουμε έμφαση στα μακροχρόνια αποτελέσματα στην περιοχή των Διαδικτυακών εφαρμογών Όμως καθώς νέες εφαρμογές αναδύονται θα υπάρξει μια φυσική μετατόπιση στην εστίαση της προσοχής μέτρησης

Τελικά έχουμε σημειώσει ότι υπάρχει σημαντικό ενδιαφέρον σε στατιστικά μοντέλα φυσικής για ιδιότητες Διαδικτύου Αυτή είναι μια περιοχή έρευνας που συχνά γεφυρώνει επιπλέον θέματα στη βιοπληροφορική κοινωνιολογία και μηχανική Δεν είχαμε το χώρο να καλύψουμε αυτό το ευρύτερο σύνολο θεμάτων Όμως έχουμε δώσει μια επισκόπηση των συνεισφορών της στατιστικής φυσικής μέχρι σήμερα στη Διαδικτυακή μοντελοποίηση και έχουμε δώσει αναφορές σε αυτήν την ερευνητική βιβλιογραφία όπου είναι σχετικό Δραστηριότητα σε αυτήν την περιοχή πιθανό να συνεχίσει και αυξηθεί στο κοντινό μέλλον

1111

Πιο Μακροπρόθεσμα Μια από τις πιο ανοικτού τέλους μελλοντικές κατευθύνσεις αφορά το τι και πώς νέα ερωτήματα θα αναδυθούν στη Διαδικτυακή μέτρηση Έχουμε δει ότι τα είδη των ερωτημάτων που διευθετήθηκαν στη Διαδικτυακή μέτρηση έχουν εξελιχθεί με το χρόνο σε πολλές περιπτώσεις η ανάδυση νέων ερωτημάτων ήταν δύσκολο να προβλεφθεί

Για παράδειγμα η έκρηξη του Παγκοσμίου Ιστού από τις αρχές ως τα μέσα της δεκαετίας του 1990 προκάλεσαν ένα τεράστιο ποσό έρευνας Από τη μια πλευρά αυτή η έρευνα ήταν κυρίως κατευθυνόμενη από τη δημοτικότητα του Ιστού ndash για παράδειγμα ένας αριθμός κατανεμημένων πληροφοριακών συστημάτων προϋπήρξε του Ιστού αλλά αυτά δεν υπόκειντο σε σημαντική προσοχή μέτρησης Από την άλλη πλευρά αυτή η έρευνα επέδειξε έναν αριθμό αποτελεσμάτων που μπορεί να θεωρηθούν θεμελιώδη όπως η παρουσία υψηλής μεταβλητότητας στα μεγέθη και τη δημοτικότητα των αντικειμένων Ιστού

Αυτό το παράδειγμα δείχνει ότι κάποια πιο μακροπρόθεσμα αναδυόμενα ερωτήματα μπορεί να κατευθυνθούν από νέες laquoεφαρμογές φονείςraquo ή από νέους τρόπους χρήσης του Διαδικτύου Αυτά είναι εξ ορισμού δύσκολο να προβλεφθούν

Ένα άλλο σύνολο πιο μακροπρόθεσμων ερωτημάτων αφορά την αυξανόμενη ενσωμάτωση του Διαδικτύου στην κοινωνία Ως τέτοια νέα ερωτήματα μέτρησης θα προκύψουν αναμφισβήτητα σε σχέση με την ανθρώπινη δραστηριότητα Για παράδειγμα καθώς η χρήση του Διαδικτύου έχει αυξηθεί στο εμπόριο υπάρχει αυξανόμενη σπουδαιότητα στην κατανόηση κακόβουλης δραστηριότητας τη μέτρηση γεωγραφικής τοποθεσίας και τη διερεύνηση της σχέσης μεταξύ της οικονομικής ανάπτυξης και της Διαδικτυακής υποδομής Αυτά τα ερωτήματα αρχίζουν να διευθετούνται μέσω εργασίας στην ασφάλεια την ανωνυμοποίηση και άλλα πεδία αλλά υπάρχουν αναμφίβολα πολλά σημαντικά ερωτήματα ακόμη να αναδυθούν

Βιβλιογραφία

Crovella M Krishnamurthy B 2006 Internet Measurement Infrastructure Traffic and Applications John Wiley amp Sons Inc 2006

ΤΕΛΟΣ ΚΑΙ Τῼ ΘΕῼ ΔΟΞΑ

  • 111 Τάσεις στη Διαδικτυακή Μέτρηση
  • 112 Δυσκολίες
  • 113 Μελλοντική Εργασία
    • 1131 Ερευνητικές Προκλήσεις
    • 1132 Αναδυόμενα Ερωτήματα
      • Βιβλιογραφία
Page 10: Μετάφραση τοῦ κεφαλαίου 11 τοῦ βιβλίου «Internet Measurement: Infrastructure, Traffic and Applications» [Translation of chapter 11 of the book «Internet

1011

Διαδικτυακή μέτρηση που μπορούν να προβλεφθούν στο κοντινό μέλλον Πολλά από αυτά τα θέματα αρχίζουν να μελετώνται αλλά δεν είναι ακόμη αναπτυγμένα ή αρκετά ώριμα για να καλυφθούν σε αυτό το βιβλίο

Η περιοχή των μετρήσεων ασυρμάτου Διαδικτύου είναι μια σημαντική αναδυόμενη περιοχή Από τη μία πλευρά η μετάδοση ασυρμάτων δεδομένων έχει χρησιμοποιηθεί στο Διαδίκτυο από τις πρώτες του μέρες ως το ARPANET Όμως στα πρώτα πειράματα του ARPANET ασύρματοι σύνδεσμοι χρησιμοποιήθηκαν για συνδέσεις δικτύου κορμού σε μακρινές τοποθεσίες συνήθως μέσω δορυφόρου Σε αντίθεση η σημασία των ασυρμάτων συνδέσμων έχει αυξηθεί δραματικά πιο πρόσφατα με την εισαγωγή της τεχνολογίας ασυρμάτων LAN Οι πιο αξιοσημείωτοι από αυτούς είναι τα πρωτόκολλα που βασίζονται στο σύνολο προτύπων IEEE 80211 (πχ WiFi)

Η φύση της ασύρματης μέτρησης είναι μάλλον διαφορετική από τη μέτρηση του ενσύρματου Διαδικτύου Η ασύρματη μέτρηση βασίζεται στη σύλληψη μετάδοσης ραδιοκυμάτων Αυτό σημαίνει ότι η ακριβής ασύρματη μέτρηση και η σωστή μετάφραση αυτών των μετρήσεων περιλαμβάνει νέα θέματα και περιορισμούς Σαν αποτέλεσμα το πεδίο της ασύρματης Διαδικτυακής μέτρησης είναι ακόμη σε υπό διαμόρφωσιν στάδια σχετικά λίγες καθοριστικές μελέτες έχουν διεξαχθεί ως τώρα

Μια άλλη αναδυόμενη περιοχή είναι τα δίκτυα αισθητήρα Αυτά είναι δίκτυα συσκευών χαμηλής ισχύος που αναμένεται να σχηματίσουν δίκτυα χωρίς σημαντική υποδομιακή υποστήριξη Υπάρχουν σημαντικά θέματα μέτρησης σχετιζόμενα με αυτά τα δίκτυα Όμως το πεδίο είναι ακόμη νεότερο από αυτό της ασυρμάτου δικτύωσης γενικά και η εργασία δεν είναι ακόμη ώριμη σε αυτήν την περιοχή

Γυρίζοντας στο ενσύρματο Διαδίκτυο ένα θέμα που δεν έχει ακόμη μελετηθεί σε βάθος είναι μετρήσεις δικτύων και κυκλοφορίας IPv6 Ενώ το πρωτόκολλο IPv6 έχει λειτουργήσει για ένα αριθμό ετών η υιοθέτηση του δεν είναι ακόμη ευρέως διαδεδομένη Σε πολλά σημεία η συμπεριφορά του IPv6 διαφέρει από το IPv4 σε μόνο λίγα σημεία αναφορικά με τις μετρήσεις έτσι δεν έχουμε εστιάσει στο IPv6 σε μεγάλο βαθμό στο βιβλίο Όμως καθώς το IPv6 γίνεται πιο ευρέως διαδεδομένο είναι πιθανό ότι νέα θέματα μέτρησης θα προκύψουν

Επιπρόσθετα όπως σημειώθηκε παραπάνω η σουίτα των εφαρμογών που χρησιμοποιούνται στο Διαδίκτυο είναι σε μια συνεχή ρευστότητα Ενώ μπορούμε να αναγνωρίσουμε γενικά μετατοπίσεις στους κυρίαρχους τύπους εφαρμογών πχ από τον Ιστό στο P2P υπάρχουν επίσης σημαντικές δευτερεύουσες μετατοπίσεις Για παράδειγμα εντός του συνόλου εφαρμογής P2P πρώιμες εφαρμογές όπως το KaZaa έχουν παραχωρήσει προτεραιότητα σε πιο πρόσφατες παραλλαγές όπως το BitTorrent Αυτές οι εφαρμογές είναι αρκετά διαφορετικές σε πολλά σημεία και αυτές οι μετατοπίσεις από μια κυρίαρχη εφαρμογή σε μια άλλη έχουν ένα σημαντικό αποτέλεσμα στη φύση της κυκλοφορίας Κοιτάζοντας στο μέλλον δικτυωμένα παιχνίδια έχουν το δυναμικό να γίνουν μια κυρίαρχη εφαρμογή (τουλάχιστον υπό όρους χρηστών αν όχι υπό όρους συνολικής κυκλοφορίας) Έχουμε προσπαθήσει να δώσουμε έμφαση στα μακροχρόνια αποτελέσματα στην περιοχή των Διαδικτυακών εφαρμογών Όμως καθώς νέες εφαρμογές αναδύονται θα υπάρξει μια φυσική μετατόπιση στην εστίαση της προσοχής μέτρησης

Τελικά έχουμε σημειώσει ότι υπάρχει σημαντικό ενδιαφέρον σε στατιστικά μοντέλα φυσικής για ιδιότητες Διαδικτύου Αυτή είναι μια περιοχή έρευνας που συχνά γεφυρώνει επιπλέον θέματα στη βιοπληροφορική κοινωνιολογία και μηχανική Δεν είχαμε το χώρο να καλύψουμε αυτό το ευρύτερο σύνολο θεμάτων Όμως έχουμε δώσει μια επισκόπηση των συνεισφορών της στατιστικής φυσικής μέχρι σήμερα στη Διαδικτυακή μοντελοποίηση και έχουμε δώσει αναφορές σε αυτήν την ερευνητική βιβλιογραφία όπου είναι σχετικό Δραστηριότητα σε αυτήν την περιοχή πιθανό να συνεχίσει και αυξηθεί στο κοντινό μέλλον

1111

Πιο Μακροπρόθεσμα Μια από τις πιο ανοικτού τέλους μελλοντικές κατευθύνσεις αφορά το τι και πώς νέα ερωτήματα θα αναδυθούν στη Διαδικτυακή μέτρηση Έχουμε δει ότι τα είδη των ερωτημάτων που διευθετήθηκαν στη Διαδικτυακή μέτρηση έχουν εξελιχθεί με το χρόνο σε πολλές περιπτώσεις η ανάδυση νέων ερωτημάτων ήταν δύσκολο να προβλεφθεί

Για παράδειγμα η έκρηξη του Παγκοσμίου Ιστού από τις αρχές ως τα μέσα της δεκαετίας του 1990 προκάλεσαν ένα τεράστιο ποσό έρευνας Από τη μια πλευρά αυτή η έρευνα ήταν κυρίως κατευθυνόμενη από τη δημοτικότητα του Ιστού ndash για παράδειγμα ένας αριθμός κατανεμημένων πληροφοριακών συστημάτων προϋπήρξε του Ιστού αλλά αυτά δεν υπόκειντο σε σημαντική προσοχή μέτρησης Από την άλλη πλευρά αυτή η έρευνα επέδειξε έναν αριθμό αποτελεσμάτων που μπορεί να θεωρηθούν θεμελιώδη όπως η παρουσία υψηλής μεταβλητότητας στα μεγέθη και τη δημοτικότητα των αντικειμένων Ιστού

Αυτό το παράδειγμα δείχνει ότι κάποια πιο μακροπρόθεσμα αναδυόμενα ερωτήματα μπορεί να κατευθυνθούν από νέες laquoεφαρμογές φονείςraquo ή από νέους τρόπους χρήσης του Διαδικτύου Αυτά είναι εξ ορισμού δύσκολο να προβλεφθούν

Ένα άλλο σύνολο πιο μακροπρόθεσμων ερωτημάτων αφορά την αυξανόμενη ενσωμάτωση του Διαδικτύου στην κοινωνία Ως τέτοια νέα ερωτήματα μέτρησης θα προκύψουν αναμφισβήτητα σε σχέση με την ανθρώπινη δραστηριότητα Για παράδειγμα καθώς η χρήση του Διαδικτύου έχει αυξηθεί στο εμπόριο υπάρχει αυξανόμενη σπουδαιότητα στην κατανόηση κακόβουλης δραστηριότητας τη μέτρηση γεωγραφικής τοποθεσίας και τη διερεύνηση της σχέσης μεταξύ της οικονομικής ανάπτυξης και της Διαδικτυακής υποδομής Αυτά τα ερωτήματα αρχίζουν να διευθετούνται μέσω εργασίας στην ασφάλεια την ανωνυμοποίηση και άλλα πεδία αλλά υπάρχουν αναμφίβολα πολλά σημαντικά ερωτήματα ακόμη να αναδυθούν

Βιβλιογραφία

Crovella M Krishnamurthy B 2006 Internet Measurement Infrastructure Traffic and Applications John Wiley amp Sons Inc 2006

ΤΕΛΟΣ ΚΑΙ Τῼ ΘΕῼ ΔΟΞΑ

  • 111 Τάσεις στη Διαδικτυακή Μέτρηση
  • 112 Δυσκολίες
  • 113 Μελλοντική Εργασία
    • 1131 Ερευνητικές Προκλήσεις
    • 1132 Αναδυόμενα Ερωτήματα
      • Βιβλιογραφία
Page 11: Μετάφραση τοῦ κεφαλαίου 11 τοῦ βιβλίου «Internet Measurement: Infrastructure, Traffic and Applications» [Translation of chapter 11 of the book «Internet

1111

Πιο Μακροπρόθεσμα Μια από τις πιο ανοικτού τέλους μελλοντικές κατευθύνσεις αφορά το τι και πώς νέα ερωτήματα θα αναδυθούν στη Διαδικτυακή μέτρηση Έχουμε δει ότι τα είδη των ερωτημάτων που διευθετήθηκαν στη Διαδικτυακή μέτρηση έχουν εξελιχθεί με το χρόνο σε πολλές περιπτώσεις η ανάδυση νέων ερωτημάτων ήταν δύσκολο να προβλεφθεί

Για παράδειγμα η έκρηξη του Παγκοσμίου Ιστού από τις αρχές ως τα μέσα της δεκαετίας του 1990 προκάλεσαν ένα τεράστιο ποσό έρευνας Από τη μια πλευρά αυτή η έρευνα ήταν κυρίως κατευθυνόμενη από τη δημοτικότητα του Ιστού ndash για παράδειγμα ένας αριθμός κατανεμημένων πληροφοριακών συστημάτων προϋπήρξε του Ιστού αλλά αυτά δεν υπόκειντο σε σημαντική προσοχή μέτρησης Από την άλλη πλευρά αυτή η έρευνα επέδειξε έναν αριθμό αποτελεσμάτων που μπορεί να θεωρηθούν θεμελιώδη όπως η παρουσία υψηλής μεταβλητότητας στα μεγέθη και τη δημοτικότητα των αντικειμένων Ιστού

Αυτό το παράδειγμα δείχνει ότι κάποια πιο μακροπρόθεσμα αναδυόμενα ερωτήματα μπορεί να κατευθυνθούν από νέες laquoεφαρμογές φονείςraquo ή από νέους τρόπους χρήσης του Διαδικτύου Αυτά είναι εξ ορισμού δύσκολο να προβλεφθούν

Ένα άλλο σύνολο πιο μακροπρόθεσμων ερωτημάτων αφορά την αυξανόμενη ενσωμάτωση του Διαδικτύου στην κοινωνία Ως τέτοια νέα ερωτήματα μέτρησης θα προκύψουν αναμφισβήτητα σε σχέση με την ανθρώπινη δραστηριότητα Για παράδειγμα καθώς η χρήση του Διαδικτύου έχει αυξηθεί στο εμπόριο υπάρχει αυξανόμενη σπουδαιότητα στην κατανόηση κακόβουλης δραστηριότητας τη μέτρηση γεωγραφικής τοποθεσίας και τη διερεύνηση της σχέσης μεταξύ της οικονομικής ανάπτυξης και της Διαδικτυακής υποδομής Αυτά τα ερωτήματα αρχίζουν να διευθετούνται μέσω εργασίας στην ασφάλεια την ανωνυμοποίηση και άλλα πεδία αλλά υπάρχουν αναμφίβολα πολλά σημαντικά ερωτήματα ακόμη να αναδυθούν

Βιβλιογραφία

Crovella M Krishnamurthy B 2006 Internet Measurement Infrastructure Traffic and Applications John Wiley amp Sons Inc 2006

ΤΕΛΟΣ ΚΑΙ Τῼ ΘΕῼ ΔΟΞΑ

  • 111 Τάσεις στη Διαδικτυακή Μέτρηση
  • 112 Δυσκολίες
  • 113 Μελλοντική Εργασία
    • 1131 Ερευνητικές Προκλήσεις
    • 1132 Αναδυόμενα Ερωτήματα
      • Βιβλιογραφία