Cómo utilizar la herramienta Ngram Viewer en Google Books
Qué saber
- En el Visor de Ngram de Google Libros, escriba una frase, elija un rango de fechas y un corpus, establezca el nivel de suavizado y haga clic en Busca muchos libros.
- Puede profundizar en los datos. Por ejemplo, para buscar la forma verbal fish, en lugar del sustantivo fish, utilice una etiqueta: buscar verbo_pescado.
- Ngram Viewer genera un gráfico que representa el uso de la frase a lo largo del tiempo. Para varias frases, cada una está representada por una línea codificada por colores.
Este artículo explica cómo utilizar la herramienta Ngram Viewer en Google Books para realizar investigaciones y realizar búsquedas avanzadas.
Cómo funciona el visor de Ngram
Un Ngram, también llamado N -gram, es un análisis estadístico del contenido del texto o del habla para encontrar norte (un número) de algún tipo de elemento en el texto.
El elemento de búsqueda puede incluir todo tipo de cosas, incluidos fonemas, prefijos, frases y letras. Aunque un Ngram es oscuro fuera de la comunidad de investigación, se usa en una variedad de campos y tiene una muchas implicaciones para los desarrolladores que codifican programas informáticos que comprenden y responden a
En el caso de Google Books Ngram Viewer, el texto a analizar proviene de la gran cantidad de libros en el dominio público que Google escaneó para poblar su motor de búsqueda Google Books. Para Google Books Ngram Viewer, Google se refiere al cuerpo del texto que va a buscar como el cuerpo. Ngram Viewer agrupa por idioma, aunque puede analizar por separado el inglés británico y el americano o agruparlos.
Vaya a Google Books Ngram Viewer en books.google.com/ngrams.
-
Escriba cualquier frase o frases que desee analizar. Separe cada frase con una coma. Google sugiere, "Albert Einstein, Sherlock Holmes, Frankenstein" para comenzar.
En las búsquedas de NGram Viewer, los elementos distinguen entre mayúsculas y minúsculas, a diferencia de las búsquedas web de Google.
Seleccione un rango de fechas. El valor predeterminado es de 1800 a 2000.
Elija un corpus. Puede buscar textos en idiomas extranjeros o en inglés y, además de las opciones estándar, es posible que observe entradas como "Inglés (2009)" o "Inglés americano (2009)" al final de la lista. Estos son corpus más antiguos que Google ha actualizado desde entonces, pero es posible que tenga alguna razón para hacer sus comparaciones con conjuntos de datos antiguos. La mayoría de los usuarios pueden ignorarlos y centrarse en los corpus más recientes.
Establezca el nivel de suavizado. Suavizar se refiere a qué tan suave es el gráfico al final. La representación más precisa refleja un nivel de suavizado de 0, pero esa configuración puede ser difícil de leer. El valor predeterminado es 3. En la mayoría de los casos, no es necesario ajustarlo.
prensa Busca muchos libros.
Con Ngram Viewer de Google, puede profundizar en los datos. Si desea buscar el verbo pez en lugar del sustantivo pez, puede hacerlo mediante etiquetas. En este caso, buscaría fish_VERB.
Google proporciona una lista completa de comandos otra documentación avanzada para usar con Ngram Viewer en su sitio web.
¿Qué muestra Ngram?
Google Books Ngram Viewer genera un gráfico que representa el uso de una frase en particular en los libros a lo largo del tiempo. Si ingresó más de una palabra o frase, cada una está representada por una línea codificada por colores para contrastar con los otros términos de búsqueda. Esto es similar a Tendencias de Google, solo la búsqueda cubre un período más largo.
Caso de estudio
Considere el estudio de caso de pasteles de vinagre. Se mencionan en Laura Ingalls Wilder Pequeña casa en la pradera serie. Explorando con Búsqueda web de Google Para obtener más información sobre los pasteles de vinagre, se revela que se consideran parte de la cocina sureña estadounidense y, de hecho, están hechos con vinagre. Se remontan a épocas en las que no todo el mundo tenía acceso a productos frescos en todas las épocas del año, pero ¿es ésa toda la historia?
Buscar en Google Ngram Viewer para Pay de vinagre, y encontrará algunas menciones del pastel tanto a principios como a finales del siglo XIX, muchas menciones en la década de 1940 y un número creciente de menciones en los últimos tiempos. Sin embargo, con un nivel de suavizado de 3, verá una meseta con respecto a las menciones en el siglo XIX. Debido a que no se publicaron muchos libros durante ese tiempo y debido a que los datos están configurados para suavizar, la imagen está distorsionada. Probablemente solo un libro mencionó el pastel de vinagre, y se promedió para evitar un pico. Al establecer el suavizado en 0, puede ver que este es precisamente el caso. El pico se centra en 1869 y hay otro pico en 1897 y 1900.
Es poco probable que nadie hablara de pasteles de vinagre el resto del tiempo: probablemente había recetas flotando por todas partes, pero la gente no escribió sobre ellos en los libros, y esa es una limitación importante de Ngram búsquedas.