Web Mining

Le Web mining – est l’application des techniques d’exploration des données pour découvrir des modèles du Web. Selon des cibles d’analyse, le Web Mining peut être divisée en trois types différents, qui sont le Web usage mining, Web content mining et le Web structure mining.


Web usage mining

Web Usage MiningLe Web usage mining est un processus d’extraction de l’information utile à partir du serveur note c.-à-d. historique des utilisateurs. Le Web usage mining est le processus de découverte de ce que les utilisateurs recherchent sur l’Internet. Quelques utilisateurs ont tendance à regarder seulement des données textuelles, tandis que quelques autres sont susceptbiles d’être intéressés par des données multimédia.


Web content mining

Le Web content mining est le processus pour découvrir l’information utile du signal des textes, d’image, audio ou vidéo sur le Web. Le Web content mining s’appelle parfois l’explortation des textes de Web, parce que le contenu des textes est le secteur le plus largement recherché. Les technologies qui sont normalement employées dans Le Web content mining sont NLP (traitement de langage naturel) et IR (de recherche documentaire). Bien que l’exploration des données soit un terme relativement nouveau, la technologie elle ne l’est pas. Les entreprises ont utilisé les ordinateurs puissants pour trier les volumes de données de module de balayage de supermarché et pour analyser des rapports de recherche de marché pendant des années. Cependant, les innovations continues dans la puissance de traitement par ordinateur, la mémoire de disque, et le logiciel statistique augmentent considérablement l’exactitude de l’analyse tout en entraînant une réduction le coût.


Web structure mining

Web Structure MiningLe Web structure mining est le processus qui consiste à employer la théorie des graphs pour analyser la structure de noeud et de raccordement d’un site Web. Selon le type de données structurales de Web, le Web structure mining peut être divisé en deux sortes :

Extraction des modèles à partir des liens hypertextes en Web : un lien hypertexte est un composant structural qui relie la page Web à un endroit différent.

Extraction de la structure de document : analyse structure tree-like des structures de page utilisation pour décrire de HTML ou de XML étiquette.

Le Web Mining a beaucoup d’avantages. Cette technologie est attrayante aussi bien pour les sociétés que les organismes gouvernementaux. Cette technologie a permis au commerce électronique de faire le marketing personnalisé, qui a par la suite comme conséquence des volumes d’échange plus élevés. Les organismes gouvernementaux emploient cette technologie pour classifier des menaces et pour lutter contre le terrorisme. Les possibilités de prévision de l’application d’exploitation peuvent des avantages la société en identifiant des activités criminelles. Les entreprises peuvent établir un meilleur rapport de client en les donnant exactement de ce qu’elles ont besoin. Les entreprises peuvent comprendre que les besoins du client mieux et eux peuvent réagir aux besoins de client plus rapidement. Les entreprises peuvent trouver, attirer et maintenir des clients ; elles peuvent sauver sur des coûts de production en utilisant la perspicacité acquise des exigences de client. Elles peuvent augmenter la rentabilité par l’évaluation de cible basée sur les profils créés. Ils peuvent même trouver que le client qui pourrait se transférer sur un concurrent la entreprise essayera de maintenir le client en fournissant des offres promotionnelles au client spécifique, de ce fait réduisant le risque de perdre un client ou des clients des escroqueries

Le Web Mining, lui-même, ne crée pas des issues, mais cette technologie une fois utilisée sur des données de nature personnelle pourrait causer des soucis. L’issue morale la plus critiquée impliquant le Web Mining est l’invasion de l’intimité. L’intimité est considérée perdue quand l’information au sujet d’un individu est obtenue, employée, ou diffusée, particulièrement si ceci se produit sans leur connaissance ou consentement.[1] Les données obtenues seront analysées, et groupées aux profils de grille ; les données seront rendues anonymes avant le groupement de sorte qu’il n’y ait aucun profil personnel. Ainsi ces applications De-individualisent les utilisateurs en les jugeant par leurs clics de souris. La De-individualisation, peut être définie comme tendance de juger et de traiter des personnes sur la base des caractéristiques de groupe au lieu sur de leurs propres différents caractéristiques et mérites.

Un autre souci important est que les entreprises rassemblant les données pour un but spécifique pourraient employer les données pour un but totalement différent, et ceci viole essentiellement les intérêts de l’utilisateur. La tendance croissante de vendre des données personnelles comme produit encourage des propriétaires de site Web à commercer des données personnelles obtenues à partir de leur emplacement. Cette tendance a augmenté la quantité de données récupérées et revendues augmentant la perception selon laquelle les limites visant à protéger l’intimité sont transgressées. Les entreprises qui achètent les données sont obligées de les rendre anonymes et ces entreprises sont considérées comme responsables de n’importe quel modèle obtenu de l’exploitation de ces données. Elles sont légalement responsables du contenu du modèle ; toutes les inexactitudes dans le modèle auront pour conséquence des procès sérieux, mais il n’y a aucune loi les empêchant de commercer les données.

Quelques algorithmes d’exploitation pourraient employer des attributs controversés comme le sexe, la couleur de peau, la religion, ou l’orientation sexuelle pour classer des individus par catégorie. Ces pratiques s’avère être contraire aux lois anti discriminations. Ce processus pourrait avoir comme conséquence le déni de service ou un privilège à un individu basé sur sa couleur, religion ou orientation sexuelle, mais cette situation peut être évité par le maintien de valeurs morales strictes par la entreprise responsable de l’extraction des données. Les données rassemblées sont rendues anonymes de sorte que les données obtenues et les modèles obtenus ne puissent pas être associés à un individu. Elles peuvent ainsi être considérées comme ne présentant aucune menace à son intimité, et peuvent permettre de tirer des informations supplémentaires en combinant deux données à conditions qu’elles ne soient pas reliées à un utilisateur.

Flux RSS

S'abonner

Me contacter

Pascal Cottereau
mp6 (site in maintenance)
Paris, France

Tel. bureau: 33 +1 77 35 36 00
E-mail.

Information Mining