Data Science & Digital Humanities

 

Journée thématique EGC & SHS 

Science des Données et Humanités numériques (SDH)

Paris mardi 23 Janvier 2018

 

Contexte

Le big data, les nouvelles interfaces de téléphonie mobile, la simulation et les bases de données interpellent les chercheurs en SHS pour discuter de leurs propre démarche et inclure dans leurs processus des pratiques qui viennent du numérique et notamment de considérer des objets de recherche (i.e. documents, entités, modèles, connaissances, règles, méta-données…). Dans la plupart des disciplines SHS le terrain, la pratique et la situation sont des cadres forts. Le numérique apporte des hypothèses différentes : la virtualité, la simulation, les objets hétérogènes, la mutualisation. Plusieurs questions se posent aux spécialistes des SHS :
- Quel crédit apporter aux bases de données et l’accumulation d’informations numériques ?
- Comment intégrer des objets numériques dans une démarche d’analyse en SHS ?
- Quelles connaissances peut - on espérer d’un traitement numérique ?
- Comment convaincre par les statistiques et/ou la simulation ?
- Comment mutualiser ses données ? l’open data, mythe ou réalité en SHS ?
L’exemple des medias sociaux est une illustration facile pour discuter de toutes ces questions. La popularité et la génération de données des medias sociaux est déroutante. Elle devient un terrain d’expérimentation au regard de théories en sciences sociales et de la communication comme par exemple le traitement des fausses informations. On peut trouver beaucoup d’autres exemples dans lesquels les données apportent un nouveau regard pertinent sur une discipline ; comme :
(1) la mise en ligne d’archives littéraires et la corrélation du discours entre deux auteurs de deux périodes différentes
(2) L’analyse du réseau social des acteurs d’archives historiques médiévales ;
(3) La mise en ligne de l’intégralité des publications de la science dans une base unique pour extraire l’évolution des thématiques
(4) les mondes numériques sur internet font émerger des controverses, et structurent la vie économique à travers le dark web et les microblogs.
(5) l’enseignement des langues et l’enseignement à distance tirent profit des comportements en ligne grâce aux MOOC.
(6) des corpus écrits et oraux contribuent à l’analyse des pathologies d’acquisition du langage en psychologie clinique, et permettent d’étudier les néologies et l’évolution des langues pour la linguistique.
…et bien d’autres encore.
L’extraction des connaissances offre de grandes perspectives pour l’exploitation de données multimedia (textuelles, sonores et graphiques). Notamment on peut attendre des apports de la part des techniques d’extraction d’information, de classification et d’apprentissage automatique, de croisements d’informations hétérogènes, d’indexation et de résumé automatique, de statistique descriptive et d’analyse probabiliste, de fouille de données visuelle qui nécessitent des adaptations à différents contextes de jeux de données et aux besoins des spécialistes en SHS.

Objectifs

L'objectif de cet atelier est de réunir des spécialistes en SHS et des spécialistes en sciences des données pour discuter ensemble de l’apport des algorithmes aux données produits par les SHS.

Thèmes de l'atelier (liste non exhaustive) :

Apprentissage automatique, Analyse statistique multivariée, Analyse des relations et des réseaux, Traitement automatique du langage naturel, Recherche d’information, Big Data, Smart Data, Sélection d'attributs, Visualisation des connaissances, Corpus Hétérogènes

Psychologie , Sociologie, Histoire, Archéologie, Communication et Media sociaux, Bibliothèques numériques, Etudes littéraires, Etudes culturelles et patrimoniales, Didactique, Intelligence économique, Linguistique, Politique, Cartographie , Démographie

Données textuelles, données musicales, données graphiques, données multimedia, données manuscriptes, données spatio-temporelles, Open data, Crowdsourcing


Comités

organisation

Nicolas Turenne UMR LISIS UPEM-INRA-CNRS Paris
nturenne AT u-pem.fr

Comité de lecture (en cours de creation)

 

Frédéric         Amblard         IRIT - UT1                              Toulouse     www 
Bruno            Bachimont       Costech UTC                             Compiègne    www 
Delphine         Battistelli     MODYCO Paris 10                         Paris        www 
Olivier          Baude           Université d'Orléans                    Orléans      www 
Serge            Bauin           CNRS                                    Paris        www 
Patrice          Bellot          LSIS Université Aix-Marseille           Marseille    www 
Charles          Bouveyron       Université de Nice                      Nice         www 
Davide           Buscaldi        LIPN Paris 13                           Paris        www 
Vincent          Claveau         IRISA                                   Rennes       www 
Mickaël          Coustaty        L3i                                     La Rochelle  www 
Benoit           Crabbe          UFRL Paris 7                            Paris        www 
Béatrice         Daille          LS2N                                    Nantes       www 
Liana            Ermakova        Université de Bretagne Occidentale      Brest        www 
Olivier          Ferret          CEA LIST                                Paris        www 
Serge            Fleury          Université Sorbonne Nouvelle - Paris 3  Paris        www 
Claire           François        INIST                                   Nancy        www 
Jean-Gabriel    Ganascia        LIP6 Paris 6                            Paris        www 
Natalia          Grabar          STL Université de Lille                 Lille        www 
Serge            Heiden          UMR IHRIM ENS de Lyon                   Lyon         www 
Agata          Jackiewicz      praxiling                               Montpellier  www  
Marie-Paule    Jacques         Lidilem                                 Grenoble     www 
Jean-Charles    Lamirel         LORIA                                   Nancy        www 
Thomas          Lebarbé         UMR Litt&Arts                           Grenoble     www 
Jean-Marc        Leblanc         CEDITEC UPEC                            Paris        www 
Jean-Philippe    Mague           ENS                                     Lyon         www 
Ioana            Manolescu       LEO INRIA                               Paris        www 
Denis            Maurel          Université Francois Rabelais            Tours        www 
Francesca        Musiani         ISCC CNRS / Paris-Sorbonne UPMC         Paris        www
Thierry          Poibeau         UMR LATTICE ENS                         Paris        www
Pascal          Poncelet        LIRMM INRIA                             Montpellier  www
Céline          Poudat          UMR BCL - Université de Nice            Nice         www
Violaine        Prince          LIRMM                                   Montpellier  www
Pierre          Ratinaud        LERASS, Toulouse 2                      Toulouse     www
Camille          Roth            Sciences Po                             Paris        www 
Francis          Rousseaux      IRCAM                                   Rheims       www 
Benoît          Sagot           ALMAnaCH INRIA                          Paris        www
Xavier-Laurent Salvador        LDI Paris 13                            Paris        www
Amalia          Todirascu       LILPA, Université de Strasbourg         Strasbourg   www
Katerina        Tzompanaki      Université de Cergy-Pontoise            Paris        www
Mathieu          Valette         ERTIM INALCO                            Paris        www
Julien          Velcin          ERIC Lab, Lyon 2                        Lyon         www
Marie-Luce      Viaud           VIM Institut National de l'Audiovisuel  Paris        www
Serena          Villata         SPARKS-WIMMICS                          Nice         www

Informations pratiques

Les propositions sont à soumettre via le site Easychair d'EGC dans le track « sciences des données et humanités numériques ». Les articles doivent être au format EGC2018 (format RNTI latex).

Peuvent être soumis des articles courts (4 pages pour présentation courte ou démo) ou des articles longs (8 à 12 pages max.) présentant des travaux aboutis ou des prises de position.

http://www.editions-rnti.fr/files/RNTI-X-Y2.1.zip.

Le site de soumission est :
https://easychair.org/conferences/submission_show_all.cgi?a=16521575

Certaines publications choisies par le comité de lecture seront publiees (en version etendue et en anglais) dans le JDMDH (journal of data mining and digital humanities).

 

Dates importantes

Réception des papiers
30 novembre 2017

Notification aux auteurs
15 décembre 2017

Date de l'atelier
23 Janvier 2018


site web 
https://sdhn2018.sciencesconf.org/