Formats3


Web y cine. Análisis comparativo de dos bases de datos para la investigación en línea

Lluís Codina i María del Valle Palma

e-mail           e-mail



1. La web invisible

A medida que aumenta el volumen de información disponible a través de la WWW se hace patente la principal paradoja de la información: su abundancia es uno de los obstáculos principales para su consumo.

¿Cómo es posible esto? Aunque con frecuencia se dice que la información es inmaterial, lo cierto es que no sólo no es inmaterial sino que su procesamiento está sometido a las limitaciones más materiales que sea posible imaginar y, como consecuencia de ello, la capacidad de procesamiento de la información de los seres humanos resulta estar tan sometida a restricciones como cualquier otro proceso material, ya sea correr los cien metros, escribir un poema o talar árboles.

Frente a la caótica realidad de la Internet, por una parte, y de las restricciones reales de la cognición humana para el procesamiento de información, por otra, no es extraño que cada vez sea más importantes la (mal) llamada Internet o web invisible, es decir, aquella parte de la web cuyo contenido es inaccesible a los motores de búsqueda y que, en cambio, proporciona las informaciones más contrastadas y de mayor calidad.

2. Bases de datos y metodología

En este trabajo presentaremos el bosquejo de un análisis comparativo de las dos mejores bases de datos sobre cine que podemos encontrar en la web. Son las siguientes:

- All Movie Guide (AMG, desde ahora).

- Internet Movie Database (IMDB,  desde ahora).

Tanto AMG como IMDB son bases de datos que contienen descripciones de films y de cineastas estructuradas en forma de registros. Estos registros aportan numerosos datos sobre cada una de estas dos entidades (films y cineastas) que pueden resultar de gran valor para los estudiosos.

Estos datos van (ver figuras de 1 a 6) desde lo más elemental, como el título y el realizador de cada film a los premios y las recaudaciones obtenidos, pasando por las fichas técnicas y artísticas, la ubicación de los rodajes, la existencia o no de segundas versiones, las frases promocionales que se usaron en el estreno y, dado el caso, errores de continuidad, errores factuales o contradicciones en los guiones, etc.

Además, los registros contienen diversas informaciones de valor añadido, como sinopsis de los films, biofilmografías de los cineastas, palabras clave, estimaciones del valor histórico y artístico de los filmes, etc. Por último, tanto AMG como IMDB (especialmente esta última) presentan muchas facilidades de consulta, de modo que es posible realizar búsquedas a partir de uno o más conceptos o parámetros.

Con este trabajo pretendemos, de una parte, contribuir al mejor conocimiento de dos herramientas de trabajo de incalculable valor para estudiosos, profesionales e investigadores del mundo del cine, como son las dos bases de datos mencionadas.

Por otro lado, pretendemos aportar criterios para estimar el valor y la calidad relativa de cada uno de estos dos recursos digitales y, por tanto, aportar elementos para posibilitar la respuesta a preguntas como estas : ¿Es suficiente el uso de una de ellas o necesitamos consultar las dos en una investigación determinada?; ¿Aportan las dos las mismas informaciones?; ¿Hay diferencias en el tratamiento cualitativo de la información?; ¿Cuáles son las diferencias cualitativas entre ellas?, etc.

Finalmente, pretendemos aportar unos primeros elementos para una metodología de análisis de esta clase de recursos digitales. Lo que aquí se presenta no es más que una propuesta que, en caso de demostrarse útil, todavía debería ser ampliada y refinada con elementos adicionales. De momento, nos conformamos con mostrar algunos de los parámetros que se podrían incluir en esta metodología, así como una muestra de los resultados que se podrían obtener.

Para nuestro análisis, por tanto, hemos comparado el tratamiento descriptivo de los registros de films y de cineastas, así como el número de campo que tienen tratamiento documental. También hemos examinado las estadísticas básicas de cada base de datos y hemos efectuado pruebas de rendimiento aplicando cuatro tests de recuperación de información. Finalmente, hemos aplicado dos tests cualitativos para comprobar la capacidad relativa para proporcionar información de contexto o información estratégica de cada base de datos.

3. Anàlisis

AMG (ver las figuras y tablas correspondientes) proporcionaba, en Octubre del 2000, información sobre más de 180.000 films y más de 246.000 cineastas de todo el mundo. De las dos bases de datos analizadas, no es la que posee mayor cantidad de información pero, en cambio, es la que realiza un mejor trabajo de tratamiento documental de la información, es decir, proporciona más información de valor añadido.

Esto último se pone de manifiesto cuando comparamos el número de campos que tienen tratamiento documental, como palabras clave, género, sinopsis, etc., en sus registros, que es igual a doce, con los de IMDB, cuyo número es únicamente de tres.

Es decir, en AMG hay doce campos que no contienen una mera transcripción de datos tomados de pressbooks u otras fuentes de información; sino que para proporcionar estas informaciones ha sido necesario realizar alguna clase de análisis intelectual sobre las mismas por parte de los colaboradores y redactores de AMG. El caso paradigmático son las palabras clave (temáticas, geográficas, cronológicas y onomásticas), las líneas argumentales, los estilos artísticos, las sinopsis y la crítica. Como resultado, en teoría, hay muchas más posibilidades de realizar búsquedas de tipo heurístico en AMG que en IMDB.

Además, AMG destaca por la calidad y la eficiencia en la presentación de estas informaciones. En los dos tests cualitativos, que hemos llamado “test Polonsky” y “test Drácula”, y que discutiremos más adelante, se manifiesta de forma patente.

Por su parte, IMDB destaca, sobre todo, por tres cosas: (1) su gran número de informaciones; (2) sus espléndidas opciones de búsqueda y obtención de información, y (3) lo que podríamos llamar como sus informaciones complementarias, por ejemplo, informaciones sobre bandas sonoras o sobre versiones alternativas de los films (censura, montaje del director, versiones para televisión, etc.).

En el primer ámbito, IMDB presenta información sobre más de 258.000 títulos y sobre más de 864.000 cineastas. En cuanto a sus opciones de búsqueda, sólo diremos que son tantas y tan numerosas que IMDB ha creado una imaginaria IMDB University, de la que sale licenciado o doctorado quien supera los diversos tutoriales en línea que es necesario practicar si se quieren conocer todas las posibilidades de IMDB.

Finalmente, IMDB es una auténtica mina de informaciones complementarias sobre films y cineastas. Desde detalles técnicos del rodaje hasta las frases utilizadas en la promoción, pasando por el presupuesto del film, la lista detallada de las composiciones de la banda sonora, webs relacionadas, etc.

Pero, probablemente, con todo, en lo que destaca IMBD sobre AMG es en el perfecto funcionamiento de todas las opciones: mientras que en AMG son frecuentes los mensajes de error del sistema, en IMDB todas las opciones funcionaron a la perfección durante las dos semanas en las que se hicieron las pruebas para este artículo (primeras semanas de Octubre del 2000).

3.1. Test Polonsky

El test Polonsky parte de lo siguiente: como es sabido, Abraham Polonsky, cuando tenía 38 años, dirigió un filme considerado como una joya del cine negro: Force of Evil (1948). Ahora bien, a pesar del éxito obtenido, tanto de crítica como de público, Polonsky no volvió a dirigir otro film hasta 1969 (Tell Them Willie Boy is Here). ¿Por qué razón un realizador joven, capaz de realizar una gran obra en uno de sus primeros trabajos, no vuelve a dirigir una película hasta 21 años después?

El test consiste en ver si en una primera revisión de los datos que proporcionan las dos bases de datos es posible: a) advertir la incógnita indicada; b) adivinar la razón de esta incógnita. Como el lector sabrá o habrá deducido, la razón fue que Polonsky pasó a formar parte de las tristemente famosas listas negras de Hollywood a causa de su negativa a testificar contra sus colegas en el Comité de Actividades Antiamericanas.

Si examinamos la manera en la que presentan sus registros las dos bases de datos podremos ver fácilmente que sólo AMG supera de manera óptima este test. Nada más abrir el registro dedicado a Polonsky, y a partir de la línea número 8 de su biografia, prácticamente sin necesidad de hacer scroll,  encontramos esta frase:

Unfortunately, Polonsky blacklisted in 1950 after refusing to testify before the House UnAmerican Activities Committee. He continued to work as a screenwriter, but didn't get another chance to direct until 1970 (sic) in Tell Them Willie Boy Is Here.

No es que IMDB no proporcione también esta información sino que, debido a la forma en la que presenta la información IMDB, muy deslavazada, es probable que a un lector poco atento le pase desapercibida. En concreto, sólo si el lector tiene la paciencia de llegar a la sección número 11 de las 14 que forman el registro podrá leer una información parecida y, aún así, bajo el título "Trivia", nombre que probablemente actuará de forma disuasoria en la lectura de muchos estudiosos.

Se puede considerar que este caso es anecdótico ya que, después de todo, no hay tantos cineastas con perfiles biográficos como éste. Nosotros, en todo caso, creemos que no es una anécdota, sino la consecuencia lógica de la forma poco afortunada de presentar la información que tiene IMBD, que contrasta con la forma espléndida en que AMG agrega y sintetiza la información. Otro test cualitativo puede reforzar esta idea; se trata del test Drácula, que exponemos a continuación.

3.2. Test Drácula

Los hechos en los que se basa este test son los siguientes: como es sabido, durante unos años el cine de Hollywood no realizaba doblajes de sus films destinados a la distribución en el extranjero sino que, cuando se trataba de una producción de cierto presupuesto, había dos o tres equipos de actores, uno para cada idioma, que rodaban el mismo film en los mismos platós de forma paralela (es, por cierto, la excusa argumental de La niña de mis ojos, de F. Trueba). Después, en cada zona idiomática se distribuía la versión que le correspondía: la versión con actores castellanos en América Latina y España; la versión francesa en Francia y Canadá, etc.

El hecho es que existe una versión de Drácula de 1931 que se rodó en los mismos platós (y con el mismo equipo técnico) donde Browning rodó su aclamada versión, pero con un equipo de actores en castellano. Esta versión la dirigió George Melford, un veterano realizador que había firmado su primer film en 1911 y que, cuando se encargó del rodaje de esta versión, ya iba, más o menos, por su film número cien.

Desde la reciente recuperación de una copia de la llamada "versión castellana" (Spanish version) de este film, se ha convertido en un film de culto, y entre los que han tenido la suerte de poderlo ver, se propaga la idea casi unánime de que se trata de una película con personalidad propia y de la misma calidad, si no superior, al film de Browning.

El test aquí consistia en lo siguiente: supongamos que un estudioso del cine fantástico se propone comprobar cuantas películas se han rodado sobre el mito del conde Drácula. Podría empezar por una opción obvia, es decir, por comprobar cuantas películas, en toda la historia del cine, tienen la palabra Drácula en el título. Si lo hace así no obtendrá la misma información en AMG que en IMDB. En la primera (AMG) es imposible que le pase desapercibido este film ya que en la lista de respuesta a esta cuestión, de los 42 títulos listados, el film que hace el número 8 aparece así: <4.5 1931 Drácula (Spanish Version)> (4.5, por cierto, es la calificación sobre un máximo de 5).

En cambio, si hacemos la misma pregunta en IMDB no hay nada en la respuesta que puede alertar al estudioso. A cambio, IMDB destaca por su capacidad cuantitativa: proporciona 94 títulos. Pero ninguno de estos títulos corresponde a la versión castellana de Melford. ¿No figura este film en la base de datos de IMDB? Sí, pero sólo se encuentra su ficha si ya se sabe lo que se quiere. Gracias a sus superiores funciones de búsqueda, es posible preguntar por todas las películas que tengan la palabra Drácula y que, al mismo tiempo, sean de lengua castellana. Entonces, efectivamente, aparece el misterioso título <Drácula/II>. Si abrimos la ficha, de nuevo es necesario tener una cierta paciencia y avanzar por la estructura del registro para llegar a un comentario que nos aclare la cuestión.

De nuevo hemos visto como, efectivamente, se pueden encontrar las mismas informaciones críticas o de contexto en una base u otra, pero en AMG suele "saltar a la vista", mientras que en IMBD sólo se repara en estas cuestiones quien ya las conoce previamente o un lector realmente paciente.

4. Conclusiones (I)

La mejor base de datos sería una combinación de las dos: la eficiencia en la presentación de información de AMG con la eficiencia técnica y funcional y la cantidad de información de IMDB.

Ello significa que, si bien para la mayor parte de necesidades de información bastaría con IMDB, si queremos estar seguros de estar obteniendo las informaciones relevantes en cada caso, es conveniente consultar AMG.

Por otra parte, si bien es cierto que IMDB proporciona una cantidad mucho más grande y mucha má variedad de información, no es menos cierto que AMG la presenta con tanta eficiencia que, cuando se dispone de un tiempo limitado para obtener la información, es preferible AMG por razones de eficiencia.

A pesar de todo, la superioridad global de IMDB es manifiesta. En nuestra metodologia, mientras que de un total teórico de 24 puntos AMG obtiene 12, IMDB obtiene 20. En porcentaje, mientras AMG está en un 50% del ideal de los 24 puntos, IMDB está en un 87%, es decir, 37 puntos por encima de su rival.

En esta puntuación AMG ha resultado perjudicada por sus constantes fallos y mensajes de error, un apartado que hemos evaluado bajo el nombre de “Rendimiento técnico” y en el que hemos tenido que otorgar un cero a AMG; así como a causa de sus escasas funciones búsqueda  y la pobreza relativa de informaciones complementarias, siempre en comparación con IMDB.

Naturalmente, estos resultados se derivan de nuestra metodologia y nuestra métrica. Otra forma de medir y decidir qué se mide puede dar lugar a otros resultados.

5. Conclusiones (II)

No podemos dejar de añadir unas segundas conclusiones, en esta ocasión relaticas a las políticas de información. Es muy significativo, por previsible, pero debería resultar insoportable, que no exista ningún proyecto en ninguno de nuestros ámbitos (Catalunya, Espanya, Europa...) que se pueda comparar con AMG o IMDB.

Debería resultar urgente el inicio de un proyecto solvente que, en poco tiempo, nos dotara de un recurso digital parecido a los anteriores pero con dos diferencias: (1) hecho desde nuestra perspectiva y (2) que defienda nuestros intereses frente a los intereses -legítimos pero diferentes- de Hollywood.

Somos conscientes de que nuestras reclamación se asemeja sospechosamente a la del ratón que pretende poner un cascabel al gato. Es bien cierto que resulta más fácil decir las cosas que hacerlas pero, como mínimo, digámoslas.

6. Fuentes

AllMovie Guide
http://allmovie.com

Internet Movie Database
http://www.imdb.com

Internet Invisible
http://www.internetinvisible.com

Invisible Web
http://www.invisibleweb.com

Anexo. Análisis comparativo AMG/IMDB: figuras y tablas

Figura 1. Modelo de registro para Films de AMG (se ofrece una traducción aproximada del nombre de los campos)

Figura 2. Modelo de registro para cineastas de AMG (traducción aproximada del nombre de los campos)

Figura 3. Modelo de registro para films de IMDB (traducción aproximada del nombre de los campos)

Figura 4. Modelo de registro para cineastas de IMDB (traducción aproximada del nombre de los campos)

Figura 5. Vista parcial de un registro de AMG del film Force of Evil, de Abraham Polonsky

Figura 6. Vista parcial de un registro de AMG del director Abraham Polonsky

Figura 7. Vista parcial de un registro de IMDB del film Force of Evil, de Abraham Polonsky

Figura 8. Vista parcial de un registro de IMDB del director Abraham Polonsky

Tabla 1. Estadísticas básicas

Base de datos

Films

Cineastas

AMG

182.441

246.188

IMDB

258.337

864.419

Fuente: AMG, IMDB, octubre del 2000

Tabla 2. Resultados tests cuantitativos

Base de datos

Test 1

Test 2

Tes t3

Test 4

AMG

-

23

55

8

IMDB

52

27

79

10

Notas:

Test1: films con la palabra Barcelona en el título

Test2: films basados en obras de Hemingway

Test3: films con guión de Rafael Azcona

Test4: films de Luis Buñuel con la colaboración de Luis Alcoriza

El guión indica que ha fallado el test

Tabla 3. Resultados tests cualitativos

Base de datos

Test Polonsky

Test Drácula

AMG

**

**

IMDB

*

*

Notas:

**= Resuelto de forma óptima. *= Resuelto de forma no óptima

Taula 4. Descripción y tratamiento documental

Base de datos

NC Films

NC Cineastas

NC TD

AMG

39

16

12

IMDB

34

12

3

Notas:

NC Films: número de campos en Films

NC Cineastas: número de campos en Cineastas

NC TD: número de campos con tratamiento documental (entre los dos modelos de registro)

Tabla 5. Valoración global

Base de datos

cLi

cTi

FB

PI

FC

RT

Valoración global

AMG

4

2

1

4

1

0

12 (50%)

IMDB

2

4

4

2

4

4

20 (87%)

Notas:

i) Cada apartado se puede valorar entre 0 y 4

ii) Significado de las columnas:

cLt: calidad de la información

cTi: cantidad de la información

FB: funciones de búsqueda

PI: presentación de la información

FC: funciones complementarias

RT: rendimiento técnico

VG: valoración global, sobre 24, absoluta y en tanto por ciento




Formats