Archives de Tag: text and data mining

Quelques informations à propos du Projet de loi Pour une République numérique – Texte n° 325 au Sénat

open-scienceVoici un résumé de l’état du projet de loi « Pour une République numérique », publié avec l’aimable autorisation de Pascale Talour

Les dates :
adopté le 26/01/2016 par l’Assemblée Nationale  transmis au Sénat le 26 janvier 2016
Discussion en séance publique au Sénat les 26, 27, 28 avril et 3 mai 2016

Deux articles concernent l’IST :
art 17 : conditions de dépôt d’un article – version finale  auteur acceptée pour publication  sur un format ouvert – une archive ouverte : accepté par l’ Assemblée Nationale et  toujours présent dans le Projet de loi présenté au Sénat

art 18 bis : concerne l’exploration de textes et données pour les besoins de la recherche publique : le texte  de cet article voté par l’Assemblée Nationale a été retiré par le Sénat
puis une nouvelle mouture a été proposée par Mme Mélot, sénatrice,  sous forme d’un amendement – voir en infra .

L’article 18 bis en question :

– art 18 bis : Le TDM en question : définition : text and data mining – fouille de texte et des données
Pour mémoire, l’exception text mining vise à autoriser l’extraction de corpus de textes et de données à des fins scientifiques : toute source légalement accessible pourrait être recopiée dans une base de données et librement partagée au sein des membres du projet scientifique
extrait d’une tribune du 06/04/2016 :  https://scoms.hypotheses.org/640L’exception text mining maintenue dans le projet de loi numérique ?

– art 18 bis :  l’amendement Mélot , au Sénat – déposé le 05/04/2016 et adopté par la Commission des Lois
http://www.senat.fr/amendements/commissions/2015-2016/325/Amdt_COM-408.html

– une réaction à cet amendement Mélot liant contrat avec les éditeurs et le TDM :
Loi République numérique : les chercheurs pourront-ils fouiller automatiquement n’importe quel texte ?
voir la tribune (08/04/2016) sur : http://www.letudiant.fr/educpros/actualite/loi-republique-numerique-les-chercheurs-auront-ils-le-droit-de-fouiller-automatiquement-n-importe-quel-texte.html

Prise de position de la CPU ( Conférence des Présidents d’Universités) pour le TDM :

Les dirigeants d’organismes de recherche et d’établissements d’enseignement supérieur demandent la liberté d’accès à la fouille de textes et de données à des fins scientifique.
En tant que responsables d’organismes de recherche et d’établissements d’enseignement supérieur et de recherche, nous souhaitons solennellement attirer votre attention sur les conséquences qu’aurait la suppression de l’article 18 bis relatif à la liberté d’accès à la fouille de textes et de données à des fins de recherche scientifique (TDM: Text and Data Mining) dans la loi Pour une République Numérique actuellement en examen au Sénat.

Lire la suite : http://www.cpu.fr/actualite/loi-pour-une-republique-numerique-defendons-notre-souverainete-scientifique/

La recherche publique pourrait rapidement disposer d’un cadre juridique sécure pour porter ses développements TDM ?
Voir l’analyse faite par Michel Vajou pour Eprist ( les responsables IST des Epst et Epic français)
les éditeurs – le gouvernement  – les besoins des chercheurs – les contraintes du  champ d’application lié aux contrats editeurs tel que le propose l’amendement Merlot etc …
 Lire la suite : http://www.eprist.fr/

et toujours : Pour une science ouverte à tous
lien : https://www.change.org/p/thierry-mandon-education-gouv-fr-pour-une-science-ouverte-%C3%A0-tous

Publicités

Une analyse sur ce que permet le Text and Data Mining

 

Libre accès et partage des données de la recherche … Vers une science ouverte ? II – L’exploration de contenus

text_mining_analytics_survey_softwareAprès la disposition permettant aux chercheurs de mettre gratuitement en ligne leurs publications réalisées dans le cadre de recherches sur fonds publics, nous allons examiner l’impact des amendements autorisant la fouille automatique de textes et de données (Text and Data Mining –TDM) sur le développement de la recherche.

Au départ cette mesure ne devait pas apparaître dans la loi ; en attendant une réglementation européenne sur la question, le Ministère de la Culture et de la Communication avait nommé une mission pour en faciliter le recours comme exception au droit d’auteur comme le signale Antoine Oury dans un article d’Actualitté. Les éditeurs, dans leur ensemble, étaient plutôt réticents à ouvrir leurs collections, même si certains grands acteurs, comme Elsevier ou Springer, accordaient des licences limitées aux chercheurs….

Pour lire la suite, voici notre source : Sciences-Po

Le Conseil National du Numérique au sujet du projet de loi pour une République numérique

logo-conseil-national-du-numerique-cnnumCommuniqué de presse du Conseil National du Numérique sur l’examen du projet de loi pour une République numérique à l’Assemblée Nationale. Le CNNum est satisfait des avancées en matière d’Open Data, de l’équilibre trouvé sur le droit à la portabilité, de la solution en matière de loyauté des plateformes, salue l’arrivée du débat sur le domaine commun informationnel (exemple du Journal d’Anne Franck et, aujourd’hui, du risque judiciaire uniquement assumé par Olivier Ertzscheid). Le CNNum déplore l’adoption de l’amendement d’imposer aux plateformes en ligne la mise en oeuvre de dispositifs techniques de reconnaissance informatisée (serait par exemple concernés les contrevenants au droit d’auteur) et que si un amendement visant à encourager le recours au logiciel libre a été adopté il n’y a pas de position affirmée en faveur d’une priorité.

Sur le droit d’exploitation secondaires pour les chercheurs :
« Les députés ont soutenu la création d’un droit d’exploitation secondaire pour les chercheurs, qui doit permettre à ces derniers de rendre librement accessibles leurs publications après une courte durée d’embargo, lorsqu’elles sont financées majoritairement par des fonds publics. Par ailleurs, les députés se sont montrés favorables à l’introduction d’une exception au droit d’auteur visant à autoriser les pratiques de fouille de textes et de données pour la recherche. Cette avancée est significative pour le rayonnement et la compétitivité de la recherche française. Le Conseil salue par ailleurs le lancement d’une mission, confiée à Charles HUOT par Fleur PELLERIN et Thierry MANDON, visant à faciliter le recours à ces techniques porteuses de nombreux potentiels pour la découverte scientifique. »

Le site du CNNum :
http://www.cnnumerique.fr/assemblee-nationale-pjlnumerique/
Lien vers le communiqué de presse :
http://www.cnnumerique.fr/wp-content/uploads/2016/01/Communique-de-presse-PJL-numerique.pdf

Text et Data Mining… (TDM)

datasets_2010-09-22_coloredL’autorisation de Text and Data Mining revient dans l’actualité :

“Fleur Pellerin, ministre de la Culture et de la Communication et Thierry Mandon, secrétaire d’État chargé de l’Enseignement supérieur et de la Recherche, ont décidé de confier à Charles Huot, président du Groupement français des industriels de l’information, une mission de concertation et de proposition pour faciliter le développement du recours en France aux technologies de fouille et d’exploration de textes et de données (« text and data mining », ou TDM). (…)”

« Les technologies de fouille et d’exploration de textes et de données, qui sont en plein développement,  favorisent, par leur application aux immenses gisements de données et de contenus numériques, l’éclosion de projets de recherche innovants. La communauté scientifique, qui nourrit de fortes attentes sur ce sujet, considère que les outils aujourd’hui mis à disposition des chercheurs restent encore limités et qu’ils devraient être élargis afin de permettre, notamment, de croiser, sans barrières financières ou techniques, les informations détenues par différents acteurs. Cette demande a été exprimée en particulier à l’occasion de la consultation en ligne conduite sur le projet de loi pour une République numérique. »

Pour en savoir plus, voir le site culturecommunication.gouv

Voir aussi l’appel conjoint de la commission des Présidents d’Université (CPU) et du CNRS sur le même sujet