inf_estructura-frecuencias-lexico-vasco

Estructura de Frecuencias del Léxico Vasco (EFLV)

Esta aplicación pone a disposición del público numerosos datos relacionados con la estructura de las frecuencias internas de las palabras vascas:

  • Frecuencia de las palabras
  • Estructura silábica de las palabras vascas: número de letras, número de sílabas, cadenas de CV, VV, VC, etc.
  • Palabras similares: añadiendo una letra, quitando letras, alterando letras, etc.
  • Sílabas repetidas, letras en grupos de dos, tres... su situación dentro de la palabra
  • Morfología relativa a cada lema, su frecuencia, su categoría gramatical, etc.

Los datos se han obtenido a partir del corpus Ereduzko prosa Gaur (EPG), aunque solo se han tenido en cuenta entradas de léxico común, es decir, las que constituyen verdaderos lemas en vasco, sin tener en cuenta los nombres propios, palabras de otros idiomas, errores, etc. De esta forma, de los 25,1 millones de palabras de EPG se han utilizado 22,7 millones en esta aplicación.

Las consultas son de tres tipos:

  • Datos: datos generales de la base de datos.
  • De los datos a las palabras: el consultante puede seleccionar los criterios sobre los que quiere hacer la consulta, de forma que la aplicación devuelve la respuesta en listas de palabras con numerosa información.
  • De las palabras a los datos: se escribe de forma una lista de palabras (puede ser cualquier texto), o se sube un fichero de texto, sobre los que la aplicación hará un análisis en cada una de las palabras.