Différences entre les versions de « Mondher »

De {}
Aller à la navigation Aller à la recherche
Ligne 3 : Ligne 3 :
 
<br>
 
<br>
 
<br>
 
<br>
'''projet en cours : indice de popularité de termes médiatiques'''
+
'''Projet en cours : ranking de termes médiatiques'''
 
<br>
 
<br>
création d'un site internet proposant un indice de popularité en temps réel des termes utilisés par les médias.
+
Quoi ?
pour une sélection de sites internets donnée, un classement des X mots les plus utilisés est présentée sous la forme d'un tableau de type indice boursier, avec les gains et les pertes en pourcents. D'autres catégories d'informations sont possibles : nom de la source qui utilise le plus un terme X, classement des différentes sources qui l'ont utilisé, noms des aut·eur·rice·s, date de rédaction. S'ajoute à ces informations la possibilité de les visualiser sous forme de graphiques en temps réel sur une timeline et/ou de compositions visuelles.
+
<br>
 +
<br>
 +
Une page web affiche un ranking en temps réel des termes utilisés dans les articles d'une sélection de médias de Suisse romande.
 +
Pour une sélection de sites internets, un classement des X mots les plus utilisés est présenté sous la forme d'un tableau de type indice boursier, avec les gains et les pertes en pourcentages de chaque terme.
 +
<br>
 +
<br>
 +
Comment ?
 
<br>
 
<br>
 
<br>
 
<br>

Version du 18 janvier 2021 à 14:12

Hello !




Projet en cours : ranking de termes médiatiques
Quoi ?

Une page web affiche un ranking en temps réel des termes utilisés dans les articles d'une sélection de médias de Suisse romande. Pour une sélection de sites internets, un classement des X mots les plus utilisés est présenté sous la forme d'un tableau de type indice boursier, avec les gains et les pertes en pourcentages de chaque terme.

Comment ?

Indice.jpg



Une structure de base de données a été créée sur sur phpMyAdmin. La base de données est structurée en catégories et sous-catégories distinctes. Toute informations récoltée est triée et classée dans la catégorie adéquate. Il y a trois catégories et trois sous-catégories :

La catégorie article : elle regroupe l’ID de la catégorie article, le titre de l’article, son header, son corps de texte, sa date de publication, sa date de modification (s’il y en a une), son url, sa source

—— La sous-catégorie source : elle regroupe l’ID de la source , son nom et son url

La catégorie article_aut·eur·ice: elle regroupe l’ID de la catégorie aut·eur·rice·s, l’ID de la sous-catégorie aut·eur·ice·s et l’ID des articles par aut·eur·rice·s

—— La sous-catégorie aut·eur·ice regroupe l’ID de chaque aut·eur·rice·s, son nom, son prénom et une courte bio (s’il y’en a une)

La catégorie article_mots: elle regroupe l’ID de la catégorie article_mots, l’ID de chaque article, l’ID de la sous-catégorie mots

—— La sous-catégorie mots : elle regroupe l’ID de chaque mot retenu et classé, le mot en question et la valeur de sa fréquence d’apparition

Diagramme base donnees.png
diagramme de la base de données dans laquelle les mots et informations récupérés seront classés et archivés

Schema indice p.png