César
PROJET
Faire une base de donnée récupérant des images de fonction et construction similaire, afin de pouvoir chercher à l'aide de DCGAN (deep learning) des ressemblances entre elles et des mixtures.
SOURCES
https://contrebandevhs.blogspot.com/
https://lupanarsvisions.blogspot.com/
https://muaddib-sci-fi.blogspot.com/
DESCRIPTION
La base de donnée est constituée de blog de film de genres de serie b (sf, fantastique, horreur etc..) qui ont la partcularitées d'avoir des les années 50 dévellopée des styles graphiques pour les affiches entre autres, très pointue. Surchargés de matières, d'effets et de couleur propre à ces films.
Les blogs son constitué d'une structure du site similaire. Mon but est de récuperer toutes les affiches de film contenu dans le site en poitant les sélecteurs css contenant les images avec l'aide de mechanize ou request, et de beautifulsoup. Commun à tout les blogs de ces sites, ce trouve la section par exemple h2Archive du blogh2 dans laquelle toutes les images sont finalement classées par années.
- le but est donc de pointer les sélecteurs css sur les articles et class spécifique dans lequel ce trouve l'"img" que l'on récupérera. "class="post-body entry-content" pour le blog si dessous par exemple.
- utilisation de la librairie requests pour se connecter au navigateur.
- Utilisation de Beautifulsoup pour récupérer les balises de la page html afin de récupérer les images.
code en approche
<syntaxhighlight lang="python">