Archive for the ‘Web sémantique’ Category

Le document de Nova spivack, « Minding the planet; the meaning and future of the semantic web »

Thursday, November 15th, 2007

 vision du future du web par Nova Spivack

Je viens de terminer la lecture du document « minding the planet » de Nova Spivack (voir le post sur Radar Network), qui est d’une qualité indéniable pour nous présenter ce qui devait être le « Semantic web 2.0 ». L’auteur blague souvent sur le fait que le sens d’un mot qui contient le terme sémantique peut être aussi ambigu. Pourtant, lorsque l’on n’a pas le contexte, il est difficile de savoir la signification de ces mots.

Sa vision futuriste du web en est une où tout le savoir s’y trouve dans un format que les applications des logiciels peuvent comprendre et résonner. De plus, en rendant ce savoir accessible aux logiciels, il serait possible de créer de nouvelles connaissances en nous faisant remarquer des similarités avec d’autres informations de domaines différents. Si cela fait longtemps que l’on parle de l’intelligence artificielle des logiciels, ce rêve a changé de forme. Avant, l’intelligence artificielle consistait en un robot assistant faisant tout le travail que l’on ne veut pas faire. Maintenant,  la vision du web sémantique en serait une de facilitatrice pour les tâches que nous devons faire et qu’il est possible avec le Web. Il y a une bonne différence entre automatisation et facilitation, une vision beaucoup plus réaliste.

C’est quoi le savoir… ce n’est pas juste de l’information, c’est de l’information utile! Donc, du contenu + le contexte… il fait référence à « sem » qui ne veut rien dire sauf si l’on peut savoir que « sem » est un mot tibétain pour « esprit ». On peut donc faire des connexions dans nos réseaux de concepts et faire de l’inférence, ce qui résultera à d’autres connexions et donc de nouvelles connaissances. Le web sémantique n’est donc pas seulement une technologie permettant de faire du raisonnement, de l’inférence et des découvertes, il pourra aussi rendre plus accessible cette connaissances et permettre d’en bâtir de nouvelles.

Les opportunités :

Le web sémantique est peut-être la plus grande révolution depuis le web lui-même. Les standards centraux existent déjà, les outils de développement et les ontologies qui définissent le savoir doivent maturer, mais ce qui pourrait propulser la technologie serait la présence de « killer apps » (des applications justes trop Nice pour les ignorer!). Est-ce que c’est la pornographie, qui une fois de plus, accélèrera l’adoption de la technologie… S’il y avait les Netscape, internet Explorer et Yahoo pour les débuts du web, des opportunités se présenteront pour une jeune entreprise (avec une plateforme, du contenu, du commerce, des recherches, etc.). Justement, je pense que c’est dans la recherche que l’on retrouvera l’avantage relatif qui démarrera l’épidémie. Qui sera le Google du web sémantique… (Un hint… probablement True Knowledege!! Je vous en reparle dès que j’ai l’accès à leur version bêta). Avec toute l’infrastructure derrière lui, google lui-même ne sera pas le prochain à développer la technologie, mais pour garder sa position concurrentielle, il achètera surement à n’importe quel prix le premier à devenir populaire.

Comme M. Spivack le dit lui-même : « on peut faire partie du côté technique ou du côté business lorsque l’on travaille sur le web sémantique». Je ne suis pas quelqu’un de très technique (je connais le HTML, CSS et autres langages de programmation), mais j’aimerais bien contribuer à rendre plus accessible cette révolution de l’Internet. Peut-être pouvoir faire connaître la technologie du web sémantique ici au Québec… Le web sémantique sera très important pour notre société, celle-ci ayant une économie basée sur le savoir!

Il y a donc des possibilités inimaginables… En raison de notre nature, notre temps et nos énergies sont limités, mais un logiciel peut travailler tout le temps, en parallèle et pour nous aider!!! Il serait en mesure de jouer avec nos documents beaucoup plus facilement que l’on peut le faire.

Voici des innovations apportées par le web sémantique selon l’esprit de Nova Spivack :

• Être en mesure d’arrêter le spam : votre logiciel d’envoi de courriel peut maintenant savoir si le contenu des messages est pertinent ou s’il faut s’en méfier!
• Plus aucun formulaire à remplir : présentement, un logiciel ne peut comprendre quelle information est nécessaire et quelle est votre situation.
• La recherche en serait améliorée : les engins de recherche pourraient fournir des réponses beaucoup plus précises et concises aux questions posées dans un langage naturel. Il pourrait même vous poser d’autres questions pour rendre sa réponse plus adéquate.
• Des agents pourraient être vos serviteurs : votre logiciel personnel pourrait regarder dans tous les endroits que vous lisez ou participez pour des choses importantes pour vous et qui vous auraient échappées. En lui fournissant du feedback, vous pourriez améliorer ses résultats.
• Faciliter les communications et le commerce : automatiser la création des relations avec des discussions passées et des documents présents sur le web ou dans des organisations.
• Aider les achats et les places de marchés
• Intégrer des bases de données avec d’autres bases de données.
Voici les choses qui doivent cependant être accomplies avant de voir apparaître la technologie du web sémantique :

1) Le développement d’outils de création des applications dans les langages appropriés  (afin de rendre la création de contenu sémantique « ease of use »)

2) Standardiser l’utilisation de certaines ontologies : les ontologies sont la sémantique, ils définissent la signification des mots tellement essentielle pour connecter l’information et le contexte. Il faut donc encore s’entendre sur un modèle commun. Les gens ont leurs propres façons de décrire les choses, ont leurs propres visions et de plus, le langage est tellement complexe.

Voici donc un exemple d’une ontologie tirée du recueil de M. Spivack :
«
A human is a living thing.
A person is a human.
A person may have a first name.
A person may have a last name.
A person must have one and only one date of birth.
A person must have a gender.
A person may be socially related to another person.
A friendship is a kind of social relationship.
A romantic relationship is a kind of friendship.
A marriage is a kind of romantic relationship.
A person may be in a marriage with only one other person at a time.
A person may be employed by an employer.
An employer may be a person or an organization.
An organization is a group of people.
An organization may have a product or a service.
A company is a type organization.
»

Il y a une certaine logique, des contraintes et une structure…

En effet, les prochaines étapes pour cette technologie sont donc, 1) la création de logiciel favorisant le développement de la technologie 2) la création d’ontologies autour de sujets ou domaines et enfin 3) l’ajout de méta-data au contenu sur le Web.

En terminant, j’aime bien l’analogie faite par l’auteur entre l’invention de l’imprimante et le web. Ce dernier a le même impact sur nos vies en facilitant le transfert des connaissances. J’ai bien hâte de voir maintenant l’impact du web sémantique sur notre relation avec le savoir et son impact sur l’intelligence artificielle des logiciels. On voit que les axes sur le graphique au début sont l’augmentation de la connexion des informations et des connexions sociales. Et cela a déjà commencé avec la montée de Facebook.

Nicolas

Retour à eVolution : blogue sur le web 3.0

Liens :

Minding the planet .pdf – Nova Spivack
Blogue de l’auteur sur le document

Un podcast sur le web sémantique de BussinessWeek pour prendre de meilleures décisions d’affaires

Tuesday, October 30th, 2007

 BusinessWeek Podcast

J’ai essayé de rentabiliser tout le temps que j’ai passé à me déplacer en voiture en cette semaine de relâche à l’université. J’ai donc rempli ce qui reste d’espace sur mon iPod de podcast dont celui de Businessweek qui fait un « CEO guide » sur le web sémantique. Il fait un excellent compte rendu de la technologie. Ce que j’ai particulièrement apprécié est le lien qu’il fait entre cette technologie avec le contexte d’affaires, donc comment le web sémantique révolutionnera le business. En effet, le web sémantique nous permettra d’avoir accès beaucoup plus facilement à la bonne information, dans n’importe quel format, et ce, afin de diminuer le risque lié à l’incertitude dans la prise de décisions (la raison d’être des gestionnaires, quoi!).

Aujourd’hui, les compagnies produisent une tonne de données qu’elles ne peuvent même pas utiliser, car elles n’en connaissent pas l’existence. Avec le web sémantique, il sera beaucoup plus facile de trouver cette information sur le web, dans différentes bases de données ou dans la compagnie même et faire des corrélations avec d’autres informations.

Dans ce podcast, BusinessWeek fait appelle à Éric Miller pour nous éclairer sur la technologie du web sémantique. Il est très bien placé pour nous en parler étant président de la firme de consultation Zepheira, «Zepheira provides solutions to integrate, navigate and manage information across personal, group and enterprise boundaries to save time and money») et aussi un chercheur du MIT (Massachusetts Institute of Technology) où il travaille sur SMILE (Semantic Interoperability of Metadata and Information in unLike Environments). SMILE est un projet très intéressant qui vaudra certainement un post à lui seul très bientôt, un projet définit comme :

«SIMILE is focused on developing robust, open source tools based on Semantic Web technologies that improve access, management and reuse among digital assets.»

Depuis 2001 que l’on parle du web sémantique, on remarque cependant un regain de popularité envers cette technologie; au fur et à mesure que le ROI sur l’implantation s’améliore, la confiance augmente envers cette technologie. Des compagnies ont réussi à établir un certain standard en 2004. Mais pourquoi ces compagnies utiliseraient-elles le web sémantique selon Éric Miller? :

1. Permettre un changement de cap dans les stratégies du département TI plus rapidement et plus facilement (il est plus facile d’apporter un changement lors d’implantation de solution d’affaires)

2. Répondre plus rapidement aux changements du marché (effectuer une nouvelle acquisition ou saisir une nouvelle opportunité)

3. Augmenter l’intelligence collective dans les organisations (travailler plus intelligemment et non plus fort)

Ce 3e avantage me fait remarquer un problème important, la présence de silo d’informations dans les organisations. Il y a souvent des données qui sont présentes dans différents logiciels non compatibles (même le nouveau Word 2007 n’est pas compatible avec l’ancien). On pourrait donc faire l’analogie avec les débuts du web où on l’utilisait pour joindre les différents protocoles (HTTP, FTP, etc.). On pourra, avec le web sémantique, défaire ce genre de silo et joindre les données de différentes applications. Lors d’une conférence à l’université de M. Stéphane Crétier, président de Garda, il nous avait fait part d’un truc pour comprendre le nombre d’activités distinctes lorsqu’il fait une acquisition. Il suffit de compter le nombre de machines à café et le nombre de photocopieurs pour comprendre que l’on peut avoir aucune interaction avec un département d’une même compagnie…

Enfin, le podcast nous fait prendre conscience que le gouvernement serait aussi l’un des secteurs où le web sémantique pourrait aider avec toutes ces informations disponibles dans toutes ces ministères. Je me suis déjà posé la question pourquoi le gouvernement n’adoptait pas plus facilement les nouvelles technologies. À moins que le tout soit secret comme pour le FBI…

Bref, le web sémantique sera peut-être le sauveur qui nous aidera à mettre de l’ordre dans l’océan d’informations que les nouvelles technologies ont crée.

Nicolas

Retour à eVolution : blogue sur le web 3.0

Liens:
Podcast - BusinessWeek - The CEO guide to the semantic web

Nova Spivack nous présente Radar Networks, une compagnie de web sémantique

Friday, October 19th, 2007

OK, je pense qu’avec ce « post » vous allez vraiment comprendre pourquoi je commence à me coucher un peu trop tard pour travailler sur ce blogue! Travailler à ce que la machine comprenne les phrases que l’on écrit… wow ce n’est pas un beau défi ça!!! On est rendu au point où (comme le mouvement du balancier) la tendance à améliorer l’interface (nous faciliter la navigation) laissera la place à l’amélioration du traitement des données par l’ordinateur pour faciliter la recherche sur le web et ceci résultera à un web plus connecté, plus ouvert et plus intelligent (le web sémantique quoi!).

Je veux vous présenter une entreprise :

Radar networks logo

Radar Networks:

Chez Radar Networks, on travaille à rendre accessible pour les consommateurs et professionnels la prochaine génération de services en ligne qui utilisera le web sémantique. Avant de construire leur produit, ils ont dû développer une nouvelle plateforme pour supporter les nouvelles possibilités de leur logiciel, car il n’existait rien d’autre de comparable sur le marché (les plateformes existantes sont trop orientées recherche pour le web sémantique et ne permettent pas une utilisation facile). Ils ne veulent pas non plus créer un engin de recherche pour compétitionner avec Google comme d’autres vont le faire (powerset and textdigger), car Radar Networks ne travaille pas sur le «natural language search», bien que le web sémantique pourra lui donner un coup de main.

Cette compagnie a été fondée par Nova Spivack. Sur le site de la compagnie, on retrouve l’information comme quoi M. Spivack est un visionnaire technologique et un entrepreneur avec presque deux décennies d’expérience dans le lancement d’entreprise Internet. En 1994, M. Spivack a co-fondé EarthWeb, une des premières compagnies de l’Internet. Il était vice-président exécutif, responsable des produits, de la stratégie et du marketing. EarthWeb connaît une forte croissance en 1999 et obtient le plus grand gain IPO (Initial public offering) de point de pourcentage en un jour de l’histoire du Nasdaq, engendrant une vague de IPO des technologies. Peu après, M. Spivack laisse le conseil d’administration d’EarthWeb et commence à conseiller des startups.

Chez EarthWeb, il aidait des institutions et des entreprises importantes à développer leurs premières présences à grande échelle sur le Web (par exemple, la bourse de New York, le musée métropolitain d’art, BMG musique, Sony et  AT&T). Il a également aidé à catalyser l’adoption de la technologie de Java en instaurant des communautés pour les professionnels (par exemple, Gamelan.com, Developer.com, et le Datamation.com).

Je vous explique ce que veut faire Radar Networks :
 
Les compagnies travaillant spécifiquement sur la recherche à l’aide du langage naturel -celui que vous lisez présentement et non les codes binaires- se servent de la sémantique, mais au niveau des mots seulement. Elles emploient les mots qui sont liés (en réseaux) par les synonymes, antonymes, homonymes et autres variations. Celles-ci s’appellent parfois les « semantic networks » (réseaux sémantiques). Basés sur ces réseaux de signification de mots, ils peuvent comprendre la signification de divers mots et expressions. Les algorithmes de recherche plus sophistiqués ne regardent pas juste les mots, ils les regardent dans le contexte, en analysant la grammaire et le reste du contenu autour d’eux. Le but ultime de cette recherche est de faire correspondre le contexte d’une question avec le contexte des documents où se trouve l’information qui nous intéresse. On peut donc ainsi faire mieux que Google qui utilise des mots-clés sans prêter attention à la signification des mots, bien mieux….

Cependant, ce type de recherche (basée sur le langage naturel) a besoin d’un certain niveau d’intelligence artificielle. En effet, réussir à ce que la machine comprenne le langage a posé beaucoup de difficultés aux scientifiques. Même si la technologie est plus puissante de nos jours, M. Spivack ne croit pas que c’est à cette machine de faire tout le boulot de comprendre la signification des informations…

C’est donc avec une philosophie un peu contraire à la recherche à l’aide du langage naturel que le web sémantique approche la signification de l’information. Il utilise plutôt les métas donnés comprendre cette information.

Dans l’approche du Web sémantique, la signification de l’information peut être encodée dans des balises, un peu comme le HTML est ajouté au contenu aujourd’hui. Une fois que cette signification (ou sémantique) est explicitement codée dans le contenu, elle peut alors être réutilisée par d’autres applications pour comprendre son contenu. Les langages standards W3C utilisés sont le RDF (ressource description framework) ou le OWL (web ontology language). Les mots et concepts dans le contenu des documents peuvent donc avoir des balises RDF ou OWL pour indiquer leur signification. Les possibilités de ces balises étaient pourtant déjà disponibles auparavant avec XML (M. Spivack donne l’exemple suivant : <sportscar>Lotus</sportscar>), mais la signification de « sportscar » devait être codée dans l’application pour comprendre. Maintenant, avec le RDF/OWL, la signification des mots est gardée dans une sorte dictionnaires que l’on appelle : ontologie. Une «ontologie» définit des faits tels que le «sportscar» est un genre de voiture, une voiture est un véhicule routier, une voiture est un produit, etc. C’est cependant une simplification un peu exagérée, le OWL et les ontologies peuvent aller beaucoup plus loin (plus que seulement définir la signification des concepts), elles peuvent également définir leurs relations logiques.

Tim Berners-Lee avait exprimé une vision dans un entretien accordé au Courrier de L’UNESCO en 2000. Il y expliquait : «J’ai un double rêve pour le Web. D’une part, je le vois devenir un moyen très puissant de coopération entre les êtres humains (Web 2.0) et dans un second temps, j’aimerais que ce soit les ordinateurs qui coopèrent. […] Quand mon rêve sera réalisé, le Web sera un univers où la fantaisie de l’être humain et la logique de la machine pourront coexister pour former un mélange idéal et puissant..» Il est vraiment trop fort ce Berners-Lee… quel chance a-t-il eu Jean Éthier, responsable de la maitrise en gestion de commerce électronique de l’université de Sherbrooke, de pouvoir rencontrer cet homme!

M. Spivack et sa compagnie Radar Networks ont mis en place la technologie nécessaire pour créer un «organisateur personnel de donnée».  On peut  ainsi accumuler courriels, contacts, photos, vidéos, musique, bref tout ce qui est digital et les transformer en format RDF et y accéder d’un seul endroit. J’ai bien hâte de voir l’application qui devrait être disponible très bientôt! On peut lire sur le site web de l’entreprise :

« Radar Networks is pioneering the next phase of the Web, sometimes referred to as Web 3.0, the Semantic Web or what we call it, “the Intelligent Web.” Using our platform, we are developing a new Web-based online service that will bring the power of the Intelligent Web to consumers, slated for Beta in 2007. »

Wow, c’est beau de voir l’évolution et comment cette technologie nous aidera à évoluer… 

Nicolas

Retour à eVolution : blogue sur le Web 3.0

Liens:

Nova round up
emergence web

Le bureau sémantique de la Digital Enterprise Research Institute et le projet NEPOMUK

Saturday, September 29th, 2007

Voici une petite vidéo interview d’un étudiant Israélien PhD de DERI qui travail activement avec les meilleurs cerveaux d’Europe sur le Web sémantique. La mission de la  « Digital Enterprise Research Institute »  est d’exploiter le web sémantique afin que des gens, des organisations et des systèmes collaborent et inter fonctionnent à l’échelle de la planète. Je vous invite à regarder ce court vidéo, car il donne des réponses claires à des questions plutôt complexes.


Qu’est-ce que le web sémantique pour lui ?
Une couche de plus par-dessus le web. En effet, le web est une belle infrastructure communicationnelle qui permet, n’importe où dans le monde, de pouvoir accéder à des données (se connecter en ligne est plutôt simple!). Ce que l’on veut avec le Web sémantique c’est que les ordinateurs puissent aller en ligne pour nous et qu’ils trouvent l’information à notre place. Pour pouvoir lui demander des questions comme « qui de mes amis seront à Boston en même temps que moi? », nous avons besoin une couche par-dessus du web existant que l’ordinateur peut comprendre. Il nous faut donc 2 langages,  un langage pour que l’internaute comprenne le contenu et un autre que l’ordinateur peut lire.

Le « Desktop » sémantique
Un projet européen regroupant plus de 60 partenaires (compagnies et université) veut prendre la technologie du web sémantique et l’appliquer à l’espace de travail de chacun soit le bureau de l’ordinateur personnel. Par exemple, sur le web, il y a toutes ces sources d’informations (place, carte routière, météo) et c’est pareil pour notre bureau. Même si ce sont nos informations personnelles, les données sont enfermées dans leur application respective (courriel, photos, document texte). Lors d’une tache, l’utilisateur a besoin de combiner toutes ces informations manuellement. « Je ne veux pas avoir à y penser dans ma tête, je veux que l’ordinateur me le montre »

Pour aller plus loin, l’article The NEPOMUK Project - On the way to the Social Semantic Desktop présente les recherches sur le bureau sémantique :

« The Social Semantic Desktop (SSD)  adopts the ideas from the Semantic Web paradigm, which aims to provide a common framework to enable information to be shared across application, enterprise and community boundaries. Formal ontologies capture both a shared conceptualization of desktop data and personal mental models. The Resource Description Framework (RDF) serves as the common data representation format between applications. This way the SSD allows information originating from individual applications distributed over several computers to be associated with each other according to its semantic context and enables novel views on the user’s data better conforming to the user’s
mental model. »

Ce texte apporte un nouveau concept, les ontologies. Les ontologies sont la technologie sur laquelle s’appuie le Web sémantique, et plus généralement,  pour la gestion de connaissance dans le contexte de systèmes distribués (partage d’information). Ils fournissent les processus à la machine (ordinateur) pour comprendre la sémantique des données et les sources d’information qui peuvent être communiquées entre les différents agents (le logiciel et les gens). Autrement dit, les informations sont maintenant compréhensibles pour l’ordinateur, aidant ainsi les gens à fouiller (rechercher), extraire, interpréter et traiter des renseignements plus facilement sur le Web.

Le projet NEPOMUK ( Network Environnement for Personnal Otology-based Management of Unifed Knowledge) travaille donc justement à la création d’un bureau sémantique. 

« The European Union project NEPOMUK aims at empowering individual knowledge workers to better exploit their personal information space and to enable collaboration within social networks across organizational boundaries. NEPOMUK brings together researchers, industrial software developers, and representative industrial users, to develop a comprehensive solution for extending the personal desktop into a collaboration environment which supports both the
personal information management and the sharing and exchange across social and organizational relations. »

De nos jours, les entreprises étendues ont réellement besoin de ce genre d’outil pour effectuer les nombreux travaux d’équipe à distance. Je devrais écrire un article plus complet à ce sujet très bientôt.

Nicolas

Retour à eVolution : blogue sur le Web 3.0

Lien:
The NEPOMUK Project - On the way to the Social Semantic Desktop