Το γλωσσικό μοντέλο Τεχνητής Νοημοσύνης GPT-3, άφησε ενεούς τους επιστήμονες όταν κατόρθωσε να συντάξει ολόκληρες παραγράφους, που να βγάζουν νόημα, χωρίς την ελάχιστη ανθρώπινη παρέμβαση. Και όχι μόνο, αφού το GPT-3 συμπλήρωνε αυτόματα υπολογιστικά φύλλα, ακόμα και γραμμές κώδικα.
Αν και τα γλωσσικά μοντέλα Τεχνητής Νοημοσύνης έχουν κάνει πραγματικά άλματα, παραμένουν απλώς εξαιρετικές μηχανές ανάγνωσης και μίμησης, με περιορισμένες, όμως, δυνατότητες κριτικής σκέψης. Αυτό είναι ένα σημαντικό πρόβλημα, εάν θέλουμε να έχουμε στην υπηρεσία μας μια αξιόπιστη μορφή Τεχνητής Νοημοσύνης. Και αυτό θέλει να δημιουργήσει η Diffbot, χάρη σε ένα λογισμικό που θα σαρώσει το περιεχόμενο του συνόλου του ίντερνετ, προκειμένου να γίνει τόσο «έξυπνο» όσο εμείς.
Γραφήματα γνώσης
Η Τεχνητή Νοημοσύνη της Diffbot θα διαβάσει κάθε σελίδα σε ολόκληρο τον δημόσιο ιστό, σε πολλές γλώσσες, και θα εξαγάγει όσα λογικά γεγονότα από αυτές τις σελίδες μπορεί.
Το συμπέρασμα αυτό μπορεί να προκύπτει αβίαστα ακόμα και για έναν μαθητή του Γυμνασίου, αλλά για έναν αλγόριθμο αποτελεί άλυτη σπαζοκεφαλιά. Και αυτό γιατί βρίσκεται ενώπιον μιας σύνθετης νοηματικής δομής, γνωστής ως γράφημα γνώσης.
Η Diffbot θέλει να το αλλάξει αυτό, αυτοματοποιώντας πλήρως τη διαδικασία κατασκευής γραφημάτων γνώσεως, δημιουργώντας το μεγαλύτερο γράφημα γνώσεων που δημιουργήθηκε ποτέ. Για να συλλέξει τα απαραίτητα δεδομένα, η Τεχνητή Νοημοσύνη της Diffbot «διαβάζει» τον ιστό όπως θα έκανε ένας άνθρωπος, αλλά προφανώς πολύ πιο γρήγορα.
Αρχικά σκανάρει κάθε ιστοσελίδα ως εικόνα, ακατέργαστα pixels, και χρησιμοποιεί αλγόριθμους αναγνώρισης εικόνας για να κατηγοριοποιήσει τη σελίδα ως έναν από είκοσι διαφορετικούς τύπους ανάρτησης: βίντεο, εικόνα, άρθρο, συμβάν, νήμα συζήτησης.
Η Diffbot εξάγει γεγονότα από σελίδες γραμμένες σε οποιαδήποτε γλώσσα, πράγμα που σημαίνει ότι μπορεί να απαντήσει σε ερωτήσεις σχετικά με τον Ισαάκ Νεύτωνα, χρησιμοποιώντας γεγονότα που λαμβάνονται από άρθρα σε κινεζικά ή αραβικά, ακόμη και αν δεν περιέχουν τον όρο Ισαάκ Νεύτων στα ελληνικά.
Η περιήγηση στον ιστό σαν άνθρωπος επιτρέπει στη Diffbot να «βλέπει» τα γεγονότα όπως εμείς. Σημαίνει επίσης ότι πλοηγείται στον ιστό όπως εμείς. Μόνο που γνωρίζει τον ιστό με τρόπο που εμείς ποτέ δεν θα μπορέσουμε.
Η Diffbot ανιχνεύει τον ιστό ασταμάτητα και αναδημιουργεί νέα γραφήματα γνώσεων κάθε τέσσερις έως πέντε ημέρες. Ως αποτέλεσμα ο αλγόριθμος της εταιρείας προσθέτει 100 έως 150 εκατομμύρια «οντότητες» γνώσεων κάθε μήνα, καθώς εμφανίζονται νέοι άνθρωποι στο διαδίκτυο, δημιουργούνται εταιρείες, κυκλοφορούν προϊόντα και αναρτώνται ατελείωτες δημοσιεύσεις. Και όλα αυτά απολύτως νόμιμα, αφού το διαδίκτυο είναι ανοιχτό για όλους, ακόμα και για αλγόριθμους - ή μάλλον περισσότερο γι' αυτούς. Αλλωστε, δεν θα ήταν παράνομο για έναν άνθρωπο να διαβάσει και να απομνημονεύσει κάθε πληροφορία που έχει δημοσιευτεί ποτέ, αν φυσικά μπορούσε. Γιατί, λοιπόν, να μην το κάνει αυτό και μια μηχανή;