Le big data, les nouvelles interfaces de téléphonie mobile, la simulation et les bases de données interpellent les chercheurs en SHS pour discuter de leurs propre démarche et inclure dans leurs processus des pratiques qui viennent du numérique et notamment de considérer des objets de recherche (i.e. documents, entités, modèles, connaissances, règles, méta-données…). Dans la plupart des disciplines SHS le terrain, la pratique et la situation sont des cadres forts. Le numérique apporte des hypothèses différentes : la virtualité, la simulation, les objets hétérogènes, la mutualisation. Plusieurs questions se posent aux spécialistes des SHS :
- Quel crédit apporter aux bases de données et l’accumulation d’informations numériques ?
- Comment intégrer des objets numériques dans une démarche d’analyse en SHS ?
- Quelles connaissances peut - on espérer d’un traitement numérique ?
- Comment convaincre par les statistiques et/ou la simulation ?
- Comment mutualiser ses données ? l’open data, mythe ou réalité en SHS ?
L’exemple des medias sociaux est une illustration facile pour discuter de toutes ces questions. La popularité et la génération de données des medias sociaux est déroutante. Elle devient un terrain d’expérimentation au regard de théories en sciences sociales et de la communication comme par exemple le traitement des fausses informations. On peut trouver beaucoup d’autres exemples dans lesquels les données apportent un nouveau regard pertinent sur une discipline ; comme :
(1) la mise en ligne d’archives littéraires et la corrélation du discours entre deux auteurs de deux périodes différentes
(2) L’analyse du réseau social des acteurs d’archives historiques médiévales ;
(3) La mise en ligne de l’intégralité des publications de la science dans une base unique pour extraire l’évolution des thématiques
(4) les mondes numériques sur internet font émerger des controverses, et structurent la vie économique à travers le dark web et les microblogs.
(5) l’enseignement des langues et l’enseignement à distance tirent profit des comportements en ligne grâce aux MOOC.
(6) des corpus écrits et oraux contribuent à l’analyse des pathologies d’acquisition du langage en psychologie clinique, et permettent d’étudier les néologies et l’évolution des langues pour la linguistique.
…et bien d’autres encore.
L’extraction des connaissances offre de grandes perspectives pour l’exploitation de données multimedia (textuelles, sonores et graphiques). Notamment on peut attendre des apports de la part des techniques d’extraction d’information, de classification et d’apprentissage automatique, de croisements d’informations hétérogènes, d’indexation et de résumé automatique, de statistique descriptive et d’analyse probabiliste, de fouille de données visuelle qui nécessitent des adaptations à différents contextes de jeux de données et aux besoins des spécialistes en SHS.
L'objectif de cet atelier est de réunir des spécialistes en SHS et des spécialistes en sciences des données pour discuter ensemble de l’apport des algorithmes aux données produits par les SHS.
Thèmes de l'atelier (liste non exhaustive) :
Apprentissage automatique, Analyse statistique multivariée, Analyse des relations et des réseaux, Traitement automatique du langage naturel, Recherche d’information, Big Data, Smart Data, Sélection d'attributs, Visualisation des connaissances, Corpus Hétérogènes
Psychologie , Sociologie, Histoire, Archéologie, Communication et Media sociaux, Bibliothèques numériques, Etudes littéraires, Etudes culturelles et patrimoniales, Didactique, Intelligence économique, Linguistique, Politique, Cartographie , Démographie
Données textuelles, données musicales, données graphiques, données multimedia, données manuscriptes, données spatio-temporelles, Open data, Crowdsourcing
organisation
Nicolas Turenne UMR LISIS UPEM-INRA-CNRS Paris
nturenne AT u-pem.fr
Comité de lecture (en cours de creation)
Frédéric Amblard IRIT - UT1 Toulouse www
Bruno Bachimont Costech UTC Compiègne www
Delphine Battistelli MODYCO Paris 10 Paris www
Olivier Baude Université d'Orléans Orléans www
Serge Bauin CNRS Paris www
Patrice Bellot LSIS Université Aix-Marseille Marseille www
Charles Bouveyron Université de Nice Nice www
Davide Buscaldi LIPN Paris 13 Paris www
Vincent Claveau IRISA Rennes www
Mickaël Coustaty L3i La Rochelle www
Benoit Crabbe UFRL Paris 7 Paris www
Béatrice Daille LS2N Nantes www
Liana Ermakova Université de Bretagne Occidentale Brest www
Olivier Ferret CEA LIST Paris www
Serge Fleury Université Sorbonne Nouvelle - Paris 3 Paris www
Claire François INIST Nancy www
Jean-Gabriel Ganascia LIP6 Paris 6 Paris www
Natalia Grabar STL Université de Lille Lille www
Serge Heiden UMR IHRIM ENS de Lyon Lyon www
Agata Jackiewicz praxiling Montpellier www
Marie-Paule Jacques Lidilem Grenoble www
Jean-Charles Lamirel LORIA Nancy www
Thomas Lebarbé UMR Litt&Arts Grenoble www
Jean-Marc Leblanc CEDITEC UPEC Paris www
Jean-Philippe Mague ENS Lyon www
Ioana Manolescu LEO INRIA Paris www
Denis Maurel Université Francois Rabelais Tours www
Francesca Musiani ISCC CNRS / Paris-Sorbonne UPMC Paris www
Thierry Poibeau UMR LATTICE ENS Paris www
Pascal Poncelet LIRMM INRIA Montpellier www
Céline Poudat UMR BCL - Université de Nice Nice www
Violaine Prince LIRMM Montpellier www
Pierre Ratinaud LERASS, Toulouse 2 Toulouse www
Camille Roth Sciences Po Paris www
Francis Rousseaux IRCAM Rheims www
Benoît Sagot ALMAnaCH INRIA Paris www
Xavier-Laurent Salvador LDI Paris 13 Paris www
Amalia Todirascu LILPA, Université de Strasbourg Strasbourg www
Katerina Tzompanaki Université de Cergy-Pontoise Paris www
Mathieu Valette ERTIM INALCO Paris www
Julien Velcin ERIC Lab, Lyon 2 Lyon www
Marie-Luce Viaud VIM Institut National de l'Audiovisuel Paris www
Serena Villata SPARKS-WIMMICS Nice www
Les propositions sont à soumettre via le site Easychair d'EGC dans le track « sciences des données et humanités numériques ». Les articles doivent être au format EGC2018 (format RNTI latex).
Peuvent être soumis des articles courts (4 pages pour présentation courte ou démo) ou des articles longs (8 à 12 pages max.) présentant des travaux aboutis ou des prises de position.
http://www.editions-rnti.fr/files/RNTI-X-Y2.1.zip.
Le site de soumission est :
https://easychair.org/conferences/submission_show_all.cgi?a=16521575
Certaines publications choisies par le comité de lecture seront publiees (en version etendue et en anglais) dans le JDMDH (journal of data mining and digital humanities).
Réception des papiers
30 novembre 2017
Notification aux auteurs
15 décembre 2017
Date de l'atelier
23 Janvier 2018