Besoins et avantages  de la fouille de données textuelles en sciences agronomiques

Ines Abdeljaoued-Tej

Pré-Publication, Document De Travail Année : 2020

Besoins et avantages de la fouille de données textuelles en sciences agronomiques

(1)

Ines Abdeljaoued-Tej

Fonction : Auteur
PersonId : 184337
IdHAL : ines-abdeljaoued-tej
ORCID : 0000-0002-1796-7897

Laboratoire de Bioinformatique, biomathématiques, biostatistiques (BIMS)

Résumé

Farming systems include intensive techniques, No-tillage, minimum intervention or organic agriculture. These systems require farmers to have a precise knowledge of agricultural practices. To this, we can add the expertise of new technologies, the control of treatment resistance, the gain of knowledge on seed varieties or the impact on the soil. This mass of information is available on the net: in scientific articles, discussion forums, specialized websites and social networks. It is information in text format, usually unstructured. The objective of this work is to provide an overview of research on textual data mining in agriculture. We present the main methods for extracting relevant information. We test the data mining on data from Scopus, Twitter and a commercial site for agricultural products. We give an example of data classification via machine learning tools. The code to perform this review is on Python.

Les systèmes agricoles vont des techniques intensives aux interventions minimalistes, en passant par le semi-direct. Ces systèmes supposent une connaissance précise des pratiques agricoles par les exploitants et les techniciens. A cela, nous pouvons ajouter la maîtrise des nouvelles technologies, le contrôle des résistances des traitement, l'acquisition des connaissances sur les variétés de semences, l'impact sur les sols, etc. Toute cette masse d'information est disponible sur le net : dans des articles scientifiques, des forums de discussions, des sites web spécialisés et les réseaux sociaux. Ce sont des informations sous format texte, généralement mal structuré. L'objectif de ce travail est de donner une vue générale de la recherche sur la fouille de données textuelles en agriculture. Nous présentons les principales méthodes permettant l'extraction d'informations pertinentes. Nous testons la fouille sur des données de Scopus, de Twitter et d'un site commercial spécialisé en produits agricoles. Nous détaillons un exemple de classification de données via les algorithmes d'apprentissage machine. Le code pour réaliser cette revue est sur Python.

Mots clés

Machine learning sentiment analysis web scraping smart farming

Domaines

Traitement du texte et du document Langage de programmation [cs.PL] Mathématiques [math] Statistiques [math.ST] Machine Learning [stat.ML]

Fichier principal

agricultureintelligente-1.pdf (1011.26 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Ines Abdeljaoued Tej : Connectez-vous pour contacter le contributeur

https://hal.science/hal-02126728

Soumis le : samedi 4 janvier 2020-11:55:44

Dernière modification le : lundi 8 avril 2024-10:42:04

Dates et versions

hal-02126728 , version 1 (12-05-2019)

hal-02126728 , version 2 (04-01-2020)

Identifiants

HAL Id : hal-02126728 , version 2

Citer

Ines Abdeljaoued-Tej. Besoins et avantages de la fouille de données textuelles en sciences agronomiques. 2020. ⟨hal-02126728v2⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

RIIP RIIP_TUNIS ORGANICEPRINTS

242 Consultations

1034 Téléchargements