Nova Spivack nous présente Radar Networks, une compagnie de web sémantique
Friday, October 19th, 2007OK, je pense qu’avec ce « post » vous allez vraiment comprendre pourquoi je commence à me coucher un peu trop tard pour travailler sur ce blogue! Travailler à ce que la machine comprenne les phrases que l’on écrit… wow ce n’est pas un beau défi ça!!! On est rendu au point où (comme le mouvement du balancier) la tendance à améliorer l’interface (nous faciliter la navigation) laissera la place à l’amélioration du traitement des données par l’ordinateur pour faciliter la recherche sur le web et ceci résultera à un web plus connecté, plus ouvert et plus intelligent (le web sémantique quoi!).
Je veux vous présenter une entreprise :

Chez Radar Networks, on travaille à rendre accessible pour les consommateurs et professionnels la prochaine génération de services en ligne qui utilisera le web sémantique. Avant de construire leur produit, ils ont dû développer une nouvelle plateforme pour supporter les nouvelles possibilités de leur logiciel, car il n’existait rien d’autre de comparable sur le marché (les plateformes existantes sont trop orientées recherche pour le web sémantique et ne permettent pas une utilisation facile). Ils ne veulent pas non plus créer un engin de recherche pour compétitionner avec Google comme d’autres vont le faire (powerset and textdigger), car Radar Networks ne travaille pas sur le «natural language search», bien que le web sémantique pourra lui donner un coup de main.
Cette compagnie a été fondée par Nova Spivack. Sur le site de la compagnie, on retrouve l’information comme quoi M. Spivack est un visionnaire technologique et un entrepreneur avec presque deux décennies d’expérience dans le lancement d’entreprise Internet. En 1994, M. Spivack a co-fondé EarthWeb, une des premières compagnies de l’Internet. Il était vice-président exécutif, responsable des produits, de la stratégie et du marketing. EarthWeb connaît une forte croissance en 1999 et obtient le plus grand gain IPO (Initial public offering) de point de pourcentage en un jour de l’histoire du Nasdaq, engendrant une vague de IPO des technologies. Peu après, M. Spivack laisse le conseil d’administration d’EarthWeb et commence à conseiller des startups.
Chez EarthWeb, il aidait des institutions et des entreprises importantes à développer leurs premières présences à grande échelle sur le Web (par exemple, la bourse de New York, le musée métropolitain d’art, BMG musique, Sony et AT&T). Il a également aidé à catalyser l’adoption de la technologie de Java en instaurant des communautés pour les professionnels (par exemple, Gamelan.com, Developer.com, et le Datamation.com).
Je vous explique ce que veut faire Radar Networks :
Les compagnies travaillant spécifiquement sur la recherche à l’aide du langage naturel -celui que vous lisez présentement et non les codes binaires- se servent de la sémantique, mais au niveau des mots seulement. Elles emploient les mots qui sont liés (en réseaux) par les synonymes, antonymes, homonymes et autres variations. Celles-ci s’appellent parfois les « semantic networks » (réseaux sémantiques). Basés sur ces réseaux de signification de mots, ils peuvent comprendre la signification de divers mots et expressions. Les algorithmes de recherche plus sophistiqués ne regardent pas juste les mots, ils les regardent dans le contexte, en analysant la grammaire et le reste du contenu autour d’eux. Le but ultime de cette recherche est de faire correspondre le contexte d’une question avec le contexte des documents où se trouve l’information qui nous intéresse. On peut donc ainsi faire mieux que Google qui utilise des mots-clés sans prêter attention à la signification des mots, bien mieux….
Cependant, ce type de recherche (basée sur le langage naturel) a besoin d’un certain niveau d’intelligence artificielle. En effet, réussir à ce que la machine comprenne le langage a posé beaucoup de difficultés aux scientifiques. Même si la technologie est plus puissante de nos jours, M. Spivack ne croit pas que c’est à cette machine de faire tout le boulot de comprendre la signification des informations…
C’est donc avec une philosophie un peu contraire à la recherche à l’aide du langage naturel que le web sémantique approche la signification de l’information. Il utilise plutôt les métas donnés comprendre cette information.
Dans l’approche du Web sémantique, la signification de l’information peut être encodée dans des balises, un peu comme le HTML est ajouté au contenu aujourd’hui. Une fois que cette signification (ou sémantique) est explicitement codée dans le contenu, elle peut alors être réutilisée par d’autres applications pour comprendre son contenu. Les langages standards W3C utilisés sont le RDF (ressource description framework) ou le OWL (web ontology language). Les mots et concepts dans le contenu des documents peuvent donc avoir des balises RDF ou OWL pour indiquer leur signification. Les possibilités de ces balises étaient pourtant déjà disponibles auparavant avec XML (M. Spivack donne l’exemple suivant : <sportscar>Lotus</sportscar>), mais la signification de « sportscar » devait être codée dans l’application pour comprendre. Maintenant, avec le RDF/OWL, la signification des mots est gardée dans une sorte dictionnaires que l’on appelle : ontologie. Une «ontologie» définit des faits tels que le «sportscar» est un genre de voiture, une voiture est un véhicule routier, une voiture est un produit, etc. C’est cependant une simplification un peu exagérée, le OWL et les ontologies peuvent aller beaucoup plus loin (plus que seulement définir la signification des concepts), elles peuvent également définir leurs relations logiques.
Tim Berners-Lee avait exprimé une vision dans un entretien accordé au Courrier de L’UNESCO en 2000. Il y expliquait : «J’ai un double rêve pour le Web. D’une part, je le vois devenir un moyen très puissant de coopération entre les êtres humains (Web 2.0) et dans un second temps, j’aimerais que ce soit les ordinateurs qui coopèrent. […] Quand mon rêve sera réalisé, le Web sera un univers où la fantaisie de l’être humain et la logique de la machine pourront coexister pour former un mélange idéal et puissant..» Il est vraiment trop fort ce Berners-Lee… quel chance a-t-il eu Jean Éthier, responsable de la maitrise en gestion de commerce électronique de l’université de Sherbrooke, de pouvoir rencontrer cet homme!
M. Spivack et sa compagnie Radar Networks ont mis en place la technologie nécessaire pour créer un «organisateur personnel de donnée». On peut ainsi accumuler courriels, contacts, photos, vidéos, musique, bref tout ce qui est digital et les transformer en format RDF et y accéder d’un seul endroit. J’ai bien hâte de voir l’application qui devrait être disponible très bientôt! On peut lire sur le site web de l’entreprise :
« Radar Networks is pioneering the next phase of the Web, sometimes referred to as Web 3.0, the Semantic Web or what we call it, “the Intelligent Web.” Using our platform, we are developing a new Web-based online service that will bring the power of the Intelligent Web to consumers, slated for Beta in 2007. »
Wow, c’est beau de voir l’évolution et comment cette technologie nous aidera à évoluer…
Nicolas
Retour à eVolution : blogue sur le Web 3.0
Liens:
