Αυτοματοποίηση: το μέλλον της επιστήμης των δεδομένων και της μηχανικής μάθησης;

Η μηχανική μάθηση ήταν μία από τις μεγαλύτερες προόδους στην ιστορία της πληροφορικής και θεωρείται πλέον ικανή να διαδραματίσει σημαντικό ρόλο στον τομέα των μεγάλων δεδομένων και της ανάλυσης. Η ανάλυση μεγάλων δεδομένων είναι μια τεράστια πρόκληση από την άποψη της επιχείρησης. Για παράδειγμα, δραστηριότητες όπως η κατανόηση του μεγάλου αριθμού διαφορετικών μορφών δεδομένων, η ανάλυση της προετοιμασίας δεδομένων και το φιλτράρισμα περιττών δεδομένων μπορεί να είναι εντατικές σε πόρους. Η πρόσληψη ειδικών επιστημόνων δεδομένων είναι μια δαπανηρή πρόταση και όχι ένα μέσο για κάθε σκοπό για κάθε εταιρεία. Οι ειδικοί πιστεύουν ότι η μηχανική μάθηση μπορεί να αυτοματοποιήσει πολλές από τις εργασίες που σχετίζονται με την ανάλυση - τόσο ρουτίνας όσο και περίπλοκες. Η αυτοματοποιημένη μηχανική μάθηση μπορεί να ελευθερώσει σημαντικούς πόρους που θα μπορούσαν να χρησιμοποιηθούν για πιο πολύπλοκες και καινοτόμες εργασίες. Η μηχανική μάθηση φαίνεται να κινείται προς αυτή την κατεύθυνση όλη την ώρα.

Αυτοματοποίηση στο πλαίσιο της τεχνολογίας των πληροφοριών

Στην πληροφορική, ο αυτοματισμός είναι η σύνδεση διαφορετικών συστημάτων και λογισμικού, που τους επιτρέπει να εκτελούν συγκεκριμένες εργασίες χωρίς καμία ανθρώπινη παρέμβαση. Στην πληροφορική, τα αυτοματοποιημένα συστήματα μπορούν να εκτελούν τόσο απλές όσο και πολύπλοκες εργασίες. Ένα παράδειγμα μιας απλής εργασίας μπορεί να είναι η ενσωμάτωση φορμών με PDF και η αποστολή εγγράφων στον σωστό παραλήπτη, ενώ η παροχή αντιγράφων ασφαλείας εκτός ιστότοπου μπορεί να είναι ένα παράδειγμα σύνθετης εργασίας.

Για να κάνετε σωστά τη δουλειά σας, πρέπει να προγραμματίσετε ή να δώσετε σαφείς οδηγίες στο αυτοματοποιημένο σύστημα. Κάθε φορά που χρειάζεται ένα αυτοματοποιημένο σύστημα για να τροποποιήσει το εύρος της εργασίας του, το πρόγραμμα ή το σύνολο οδηγιών πρέπει να ενημερώνεται από κάποιον. Αν και το αυτοματοποιημένο σύστημα είναι αποτελεσματικό στη δουλειά του, μπορεί να προκύψουν σφάλματα για διάφορους λόγους. Όταν εμφανίζονται σφάλματα, η βασική αιτία πρέπει να εντοπιστεί και να διορθωθεί. Σαφώς, για να κάνει τη δουλειά του, ένα αυτοματοποιημένο σύστημα εξαρτάται πλήρως από τους ανθρώπους. Όσο πιο περίπλοκη είναι η φύση της εργασίας, τόσο μεγαλύτερη είναι η πιθανότητα λαθών και προβλημάτων.

Ένα κοινό παράδειγμα αυτοματισμού στη βιομηχανία πληροφορικής είναι η αυτοματοποίηση της δοκιμής διεπαφών χρήστη που βασίζονται στον ιστό. Οι θήκες δοκιμών εισάγονται στο σενάριο αυτοματισμού και η διεπαφή χρήστη δοκιμάζεται ανάλογα. (Για περισσότερες πληροφορίες σχετικά με την πρακτική εφαρμογή της μηχανικής μάθησης, ανατρέξτε στην ενότητα Machine Learning and Hadoop στο Next Generation Fraud Detection.)

Το επιχείρημα υπέρ του αυτοματισμού είναι ότι εκτελεί συνήθεις και επαναλαμβανόμενες εργασίες και αφήνει τους υπαλλήλους να κάνουν πιο πολύπλοκες και δημιουργικές εργασίες. Ωστόσο, υποστηρίζεται επίσης ότι η αυτοματοποίηση έχει αποκλείσει μεγάλο αριθμό εργασιών ή ρόλων που είχαν εκτελεστεί προηγουμένως από ανθρώπους. Τώρα, με τη μηχανική μάθηση να εισέρχεται σε διάφορους κλάδους, ο αυτοματισμός μπορεί να προσθέσει μια νέα διάσταση.

Το μέλλον της αυτοματοποιημένης μηχανικής μάθησης;

Η ουσία της μηχανικής μάθησης είναι η ικανότητα ενός συστήματος να μαθαίνει συνεχώς από τα δεδομένα και να εξελίσσεται χωρίς ανθρώπινη παρέμβαση. Η μηχανική μάθηση είναι ικανή να λειτουργήσει σαν ανθρώπινος εγκέφαλος. Για παράδειγμα, οι μηχανές προτάσεων σε ιστότοπους ηλεκτρονικού εμπορίου μπορούν να αξιολογήσουν τις μοναδικές προτιμήσεις και τις προτιμήσεις ενός χρήστη και να δώσουν συστάσεις για τα πιο κατάλληλα προϊόντα και υπηρεσίες για να διαλέξετε. Δεδομένης αυτής της δυνατότητας, η μηχανική μάθηση θεωρείται ιδανική για την αυτοματοποίηση σύνθετων εργασιών που σχετίζονται με μεγάλα δεδομένα και αναλύσεις. Έχει ξεπεράσει τους σημαντικούς περιορισμούς των παραδοσιακών αυτοματοποιημένων συστημάτων που δεν επιτρέπουν την ανθρώπινη παρέμβαση σε τακτική βάση. Υπάρχουν πολλαπλές μελέτες περιπτώσεων που καταδεικνύουν την ικανότητα της μηχανικής μάθησης να εκτελεί σύνθετες εργασίες ανάλυσης δεδομένων, οι οποίες θα συζητηθούν αργότερα σε αυτό το άρθρο.

Όπως ήδη αναφέρθηκε, η ανάλυση μεγάλων δεδομένων είναι μια προκλητική πρόταση για τις επιχειρήσεις, η οποία μπορεί εν μέρει να ανατεθεί σε συστήματα μηχανικής μάθησης. Από επιχειρηματική σκοπιά, αυτό μπορεί να αποφέρει πολλά οφέλη όπως η απελευθέρωση πόρων της επιστήμης δεδομένων για πιο δημιουργικές και κρίσιμες εργασίες, υψηλότερο φόρτο εργασίας, λιγότερο χρόνο για την ολοκλήρωση των εργασιών και αποδοτικότητα κόστους.

Μελέτη περίπτωσης

Το 2015, οι ερευνητές του MIT άρχισαν να εργάζονται σε ένα εργαλείο επιστήμης δεδομένων που μπορεί να δημιουργήσει προγνωστικά μοντέλα δεδομένων από μεγάλες ποσότητες ακατέργαστων δεδομένων χρησιμοποιώντας μια τεχνική που ονομάζεται αλγόριθμοι σύνθεσης βαθιάς λειτουργίας. Οι επιστήμονες ισχυρίζονται ότι ο αλγόριθμος μπορεί να συνδυάσει τα καλύτερα χαρακτηριστικά της μηχανικής μάθησης. Σύμφωνα με τους επιστήμονες, το έχουν δοκιμάσει σε τρία διαφορετικά σύνολα δεδομένων και επεκτείνουν τη δοκιμή για να συμπεριλάβουν περισσότερα. Σε μια εργασία που θα παρουσιαστεί στο Διεθνές Συνέδριο για την Επιστήμη και την Ανάλυση Δεδομένων, οι ερευνητές James Max Kanter και Kalyan Veeramachaneni δήλωσαν: "Χρησιμοποιώντας μια αυτοματοποιημένη διαδικασία συντονισμού, βελτιστοποιούμε ολόκληρη τη διαδρομή χωρίς ανθρώπινη συμμετοχή, επιτρέποντάς της να γενικευτεί σε διαφορετικά σύνολα δεδομένων".

Ας δούμε την πολυπλοκότητα της εργασίας: ο αλγόριθμος έχει αυτό που είναι γνωστό ως δυνατότητα αυτόματης προσαρμογής, με τη βοήθεια των οποίων μπορούν να ληφθούν ή να εξαχθούν πληροφορίες ή τιμές από ακατέργαστα δεδομένα (όπως η ηλικία ή το φύλο), και μετά τα δεδομένα πρόβλεψης μοντέλα μπορούν να δημιουργηθούν. Ο αλγόριθμος χρησιμοποιεί πολύπλοκες μαθηματικές συναρτήσεις και μια θεωρία πιθανοτήτων που ονομάζεται Gaussian Copula. Είναι επομένως εύκολο να κατανοήσουμε το επίπεδο πολυπλοκότητας που μπορεί να χειριστεί ο αλγόριθμος. Αυτή η τεχνική έχει επίσης κερδίσει βραβεία σε διαγωνισμούς.

Η μηχανική μάθηση θα μπορούσε να αντικαταστήσει την εργασία

Συζητείται σε όλο τον κόσμο ότι η μηχανική μάθηση θα μπορούσε να αντικαταστήσει πολλές θέσεις εργασίας επειδή εκτελεί εργασίες με την αποτελεσματικότητα του ανθρώπινου εγκεφάλου. Στην πραγματικότητα, υπάρχει κάποια ανησυχία ότι η μηχανική μάθηση θα αντικαταστήσει τους επιστήμονες δεδομένων και φαίνεται να υπάρχει μια βάση για τέτοια ανησυχία.

Για τον μέσο χρήστη που δεν έχει δεξιότητες ανάλυσης δεδομένων αλλά έχει διαφορετικούς βαθμούς αναλυτικών αναγκών στην καθημερινή του ζωή, δεν είναι εφικτό να χρησιμοποιούν υπολογιστές που μπορούν να αναλύσουν τεράστιους όγκους δεδομένων και να παρέχουν δεδομένα ανάλυσης. Ωστόσο, οι τεχνικές επεξεργασίας φυσικής γλώσσας (NLP) μπορούν να ξεπεράσουν αυτόν τον περιορισμό διδάσκοντας στους υπολογιστές να αποδέχονται και να επεξεργάζονται τη φυσική ανθρώπινη γλώσσα. Με αυτόν τον τρόπο, ο μέσος χρήστης δεν χρειάζεται εξελιγμένες αναλυτικές λειτουργίες ή δεξιότητες.

Η IBM πιστεύει ότι η ανάγκη για επιστήμονες δεδομένων μπορεί να ελαχιστοποιηθεί ή να εξαλειφθεί μέσω του προϊόντος της, της Watson Natural Language Analytics Platform. Σύμφωνα με τον Marc Atschuller, αντιπρόεδρο ανάλυσης και επιχειρησιακής νοημοσύνης στο Watson, «Με ένα γνωστικό σύστημα όπως το Watson, απλώς κάντε την ερώτησή σας - ή εάν δεν έχετε ερώτηση, απλώς ανεβάζετε τα δεδομένα σας και ο Watson μπορεί να τα δει και συμπεραίνουμε τι μπορεί να θέλετε να μάθετε. "

συμπέρασμα

Ο αυτοματισμός είναι το επόμενο λογικό βήμα στην μηχανική μάθηση και ήδη βιώνουμε τα αποτελέσματα στην καθημερινή μας ζωή-ιστότοποι ηλεκτρονικού εμπορίου, προτάσεις φίλων στο Facebook, προτάσεις δικτύου LinkedIn και ταξινομήσεις αναζήτησης Airbnb. Λαμβάνοντας υπόψη τα παραδείγματα που δίνονται, δεν υπάρχει αμφιβολία ότι αυτό μπορεί να αποδοθεί στην ποιότητα της παραγωγής που παράγεται από αυτοματοποιημένα συστήματα μηχανικής μάθησης. Παρά τις ιδιότητες και τα οφέλη της, η ιδέα της μηχανικής μάθησης που προκαλεί τεράστια ανεργία φαίνεται κάπως υπερβολική αντίδραση. Οι μηχανές αντικαθιστούν τον άνθρωπο σε πολλά σημεία της ζωής μας εδώ και δεκαετίες, αλλά οι άνθρωποι εξελίχθηκαν και προσαρμόστηκαν για να παραμείνουν επίκαιροι στη βιομηχανία. Σύμφωνα με την άποψη, η μηχανική μάθηση για όλη τη διακοπή της είναι απλώς ένα άλλο κύμα στο οποίο θα προσαρμοστούν οι άνθρωποι.


Postρα δημοσίευσης: 03-20 Αυγούστου