Besoins et avantages de la fouille de données textuelles en sciences agronomiques - Institut Pasteur de Tunis Accéder directement au contenu
Pré-Publication, Document De Travail Année : 2020

Besoins et avantages de la fouille de données textuelles en sciences agronomiques

Résumé

Farming systems include intensive techniques, No-tillage, minimum intervention or organic agriculture. These systems require farmers to have a precise knowledge of agricultural practices. To this, we can add the expertise of new technologies, the control of treatment resistance, the gain of knowledge on seed varieties or the impact on the soil. This mass of information is available on the net: in scientific articles, discussion forums, specialized websites and social networks. It is information in text format, usually unstructured. The objective of this work is to provide an overview of research on textual data mining in agriculture. We present the main methods for extracting relevant information. We test the data mining on data from Scopus, Twitter and a commercial site for agricultural products. We give an example of data classification via machine learning tools. The code to perform this review is on Python.
Les systèmes agricoles vont des techniques intensives aux interventions minimalistes, en passant par le semi-direct. Ces systèmes supposent une connaissance précise des pratiques agricoles par les exploitants et les techniciens. A cela, nous pouvons ajouter la maîtrise des nouvelles technologies, le contrôle des résistances des traitement, l'acquisition des connaissances sur les variétés de semences, l'impact sur les sols, etc. Toute cette masse d'information est disponible sur le net : dans des articles scientifiques, des forums de discussions, des sites web spécialisés et les réseaux sociaux. Ce sont des informations sous format texte, généralement mal structuré. L'objectif de ce travail est de donner une vue générale de la recherche sur la fouille de données textuelles en agriculture. Nous présentons les principales méthodes permettant l'extraction d'informations pertinentes. Nous testons la fouille sur des données de Scopus, de Twitter et d'un site commercial spécialisé en produits agricoles. Nous détaillons un exemple de classification de données via les algorithmes d'apprentissage machine. Le code pour réaliser cette revue est sur Python.
Fichier principal
Vignette du fichier
agricultureintelligente-1.pdf (1011.26 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-02126728 , version 1 (12-05-2019)
hal-02126728 , version 2 (04-01-2020)

Identifiants

  • HAL Id : hal-02126728 , version 2

Citer

Ines Abdeljaoued-Tej. Besoins et avantages de la fouille de données textuelles en sciences agronomiques. 2020. ⟨hal-02126728v2⟩
242 Consultations
1034 Téléchargements

Partager

Gmail Facebook X LinkedIn More