Extraer palabras clave usando Python

Las palabras clave son términos que representan los temas o temas principales de un escrito, discurso o conversación. Actúan como etiquetas o rótulos que ayudan a las personas a captar rápidamente la esencia del contenido.

En este tutorial aprenderemos cómo extraer palabras clave usando Python. Hay tantas bibliotecas de Python para la tarea de extraer palabras clave, las mejores son spaCy, Rake-Nltk, YAKE. En este tutorial, usaremos Rake-NLTK ya que es apto para principiantes y fácil de instalar. Puedes instalarlo fácilmente usando el comando pip; instalación de pip rake-nltk.

RAKE significa Extracción rápida y automática de palabras clave. Solo está diseñado para extraer palabras clave utilizando la biblioteca NLTK en Python. Ahora veamos cómo usar esta biblioteca para extraer palabras clave.

Primero comience importando el módulo Rake desde la biblioteca rake-nltk:

from rake_nltk import Rake
rake_nltk_var = Rake()

Ahora almacenaremos algo de texto en una variable:

text = """ Python is a general-purpose programming language created in the late 1980s by Guido van Rossum. It is known for its readability, with a syntax that resembles plain English, and its versatility, being used for everything from web development to data science. 
"""

Ahora extraigamos las palabras clave del texto e imprimamos el resultado:

rake_nltk_var.extract_keywords_from_text(text)
keyword_extracted = rake_nltk_var.get_ranked_phrases()
print(keyword_extracted)

Conclusión

El proceso de extracción de palabras clave nos ayuda a identificar la importancia de las palabras en un texto. Esta tarea también se puede utilizar para modelar temas. Es muy útil extraer palabras clave para indexar los artículos en la web, de modo que las personas que buscan las palabras clave puedan obtener los mejores artículos para leer.

10.55 GEEK