sábado, 31 de octubre de 2015

Proyecto WNKNT: Dia 10

Hoy he tenido dos fases en cuanto al trabajo. En primer lugar he corregido los tres primeros capítulos para subsanar un par de erratas, eliminar las palabras en mayúsculas (que no venian a cuento de nada, pero que las dejé porque estaban ahí) y cambiar la forma en que la subordinada del policía llama a los demás. Calculo que habré tardado tres cuartos de hora o algo menos entre todos los capítulos. Si soleis descargar y guardar los subtitulos para verlos en otro momento corregid los que ya teneis. Los enlaces no han cambiado.

La otra fase es la traducción normal. Han sido dos sesiones. La primera, de 51 minutos, para las lineas 208-373. En este caso he eliminado una linea, que solo mostraba el nombre del fansub en letras destacadas. Como pongo siempre los títulos de crédito al final la he eliminado. La segunda sesión, de 22 minutos me ha dado para las lineas 374-448. Sacando la media, 3.29 lineas por minuto. Tengo que ponerme las pilas.

A propósito, que no se me olvide. Mis agradecimientos a "la que no quiere ser nombrada".

Un saludo.

viernes, 30 de octubre de 2015

Proyecto WNKNT: Dia 9

Hoy he sacado tiempo para dos sesiones, aunque tampoco he estado mucho tiempo. No se que me pasa ultimamente pero estoy muy cansado. Quizás tenga que ver el cambio de hora reciente, que aun esté adaptando, quien sabe.

Vamos a lo de siempre, el balance diario. La primera sesión, de 52 minutos, me ha dado para las lineas 1-177. La segunda, 12 minutos y las lineas 178-207. En total, 3.23 lineas por minuto.

Queria comentar una cosa, ya que estoy. Al parecer, Irya (si, quien mencionaba ayer) me ha dicho que no podía localizar el subtítulo experimental. Os explico como almaceno mis subtitulos para que no os ocurra lo que a ella.

Como ya sabreis, yo subo los subtitulos a un webhosting llamado Box.net. En ese hosting los tengo organizados por carpetas para cada traducción.

De ahí comparto la carpeta y cada uno de los subs de forma independiente. El enlace a la carpeta lo pongo en el post con las condiciones de distribución (los teneis en la barra derecha). El enlace a cada subtitulo lo pongo en el post correspondiente al capitulo finalizado.

Aqui teneis el enlace al post de distribucion: http://acerswap-recovery.blogspot.com.es/2015/10/watashi-no-kirai-na-tantei-distribucion.html

Y aqui el de la carpeta: https://app.box.com/s/xj6k0mi00vor3bsohhbn02k3dqpm8ga3

Nos vemos mañana. Un saludo.

jueves, 29 de octubre de 2015

Proyecto WNKNT: Dia 8. Fin del tercer capítulo.



Por fin, y tras unos dias de bajo rendimiento, está terminado el tercero de los capítulos. Esta vez, como prometí hay dos versiones. La versión "normal" es la definitiva. Ha sido revisada y se han corregido varios errores. En ella, los protagonistas se hablan de usted (algo que Irya me recomendó en el foro de Asia-Team). Si encontrais algun fallo, por favor avisadme.

La otra versión es la versión básica que hice, sin correcciones. Contiene por tanto diversos errores (por ejemplo, menciona "una altar" porque inicialmente lo había traducido como "una capilla" y lo cambié con la opción de reemplazar automáticamente) y alguna frase que no suena del todo bien. Quizás os interese ver las diferencias entre una versión corregida y una que no lo está.

¿Vamos a por las estadísticas? Hoy he hecho las lineas 642-847 en 54 minutos. 3.80 lineas por minuto. En total, el capítulo ha requerido 246 minutos (4 horas y 6 minutos), o 3.44 lineas por minuto.

Aqui teneis el enlace de la versión normal. La versión "experimental" la teneis en la carpeta de subtitulos de box.com


Un saludo.

miércoles, 28 de octubre de 2015

Proyecto WNKNT: Dia 7

Como esperaba, dia infructuoso. Toda la mañana en el hospital sin poder hacer nada, y por la tarde muerto de sueño.

Total, lineas 508-641 en 41 minutos (ya sabeis que si no hago un minimo de 100 lineas no estoy a gusto). 3.24 lineas por minuto.

Mañana, por narices termino el capitulo. Palabra.

Un saludo.

martes, 27 de octubre de 2015

Proyecto WNKNT: Dia 6.

Buajjj.

Dia de desgana.

Entre que mi hermana estaba enferma (espero no contagiarme), que tenía que venir el técnico de la lavadora (y mañana también vendrá con un compeñero) no tengo ganas ni de escribir este post.

Hoy han caido dos sesiones, lineas 168-328, 51 minutos y lineas 329-507, 49 minutos. Total: 3.39 lineas por minuto.

Mañana, a ver a mi neurologo como cada año, esperemos que no aprovechen para venir los técnicos mientras no estoy. Para los subs, mal presagio.

Hasta mañana.

lunes, 26 de octubre de 2015

Proyecto WNKNT: Dia 5.

Dia poco fructífero. Tenía que enviar unos documentos a la universidad y me he tirado toda la mañana para localizar desde donde se enviaban. ¡Y aun así tampoco los pude enviar por allí! Eso quiere decir que no pude aprovechar bien la mañana, y tampoco he podido dedicarle tiempo esta tarde.

He hecho las lineas 1-167, en los 51 minutos que he podido sacar hoy. Son 3.27 lineas por minuto.

En cuanto a la calidad, estoy probando a usar el tuteo completo en este capítulo. A ver como queda.

Un saludo.

domingo, 25 de octubre de 2015

Proyecto WNKNT: Dia 4. Fin del segundo capítulo.



Bufff. Un fast-release. 3 horas y 22 minutos para sacar el episodio en el dia (862 lineas, 4.27 lineas por minuto). Estoy hecho polvo, pero me interesaba sacarlo lo antes posible para tener el feedback post-primer capítulo. No se si se me habra colado algún fallo, porque entre la "señorita propietaria" y el "señor detective" las cosas se van poniendo mas fluidas.

Aqui termina el primer capítulo, en el que se resuelve todo el tema con un desenlace inesperado. Las deducciones de Akemin no tienen tampoco desperdicio.

Bueno, aqui os dejo el enlace:


Disfrutad el capitulo y me dejais unas opiniones, que ya sabeis que no muerdo y las suelo contestar.

sábado, 24 de octubre de 2015

Proyecto WNKNT: Dia 3. Fin del primer capítulo.



Por fin, terminado el primer capitulo. He hecho varios experimentos pero este es el que mas coherente me parece: ella y el se llaman de usted, ambos de tu con la policía (a excepción de la mujer policía, con la que ella no se lleva demasiado bien), y de tu con Ryuhei a partir de la mitad del capítulo. Con ella me fiaré mas de la edad y con el del estátus de su interlocutor. También ella en caso de mezclar personas con distinto grado de cercanía tiende a usar el "vosotros" mientras el usa el "ustedes" (salvo alguna excepción). Vere como evoluciona, pero en el primer capitulo es como mejor me suena.

Necesito feedback sobre este tema, así que por favor echadme una mano lo antes posible (mejor ahora que dentro de cinco capitulos).

Sobre el capítulo uno, es el primer capitulo de un arco de dos capítulos. Solo ocurre, por lo que he visto, con el primero, aunque no descarto que el último sea tambien así.

Vamos a por el balance y los enlaces.

Hoy he hecho una sesion solamente, con las lineas 717-806, que me ha durado 24 minutos (3.71 lineas por minuto), y luego una revisión y la retemporización del final del capítulo para incluir la preview del siguiente, que estaba desincronizado.

En total el capítulo me ha llevado 239 minutos, 3.37 lineas por minuto. Algo lamentable tardar 4 horas para un capitulo de 45 minutos, pero siempre me pasa con los primeros capitulos, que voy mas lento.

El enlace para descargarlo es el siguiente:


Es muy posible que sustituya el subtitulo por una nueva versión, asi que estad atentos.

Un saludo y disfrutadlo.

Watashi no Kirai na Tantei: Distribución


Debido a los distintos problemas que he tenido con otras páginas, establezco los siguientes terminos para la distribución de estos subtitulos:

1. Estos subtitulos están realizados para un uso estrictamente personal. No se permite ningun uso con animo de lucro.
2. Queda prohibida la publicación de estos subtítulos en otras páginas. Quedan incluidas las modificaciones, resincronizaciones y especialmente su incrustación y publicación en forma de hardsub.
3. Los subtitulos están basados en una versión en inglés de Hello Heydays, que mantiene todos sus derechos sobre la versión original.

La descarga de estos subtitulos supone la aceptación de estos términos. En caso de violación de sus clausulas, me reservo el derecho a retirarlos, modificar los enlaces, denunciar los videos alojados en otras páginas o cualquier otra acción que considere oportuno.

Los subtítulos están alojados en


y corresponden con el torrent

viernes, 23 de octubre de 2015

Proyecto WNKNT: Dia 2

Hoy sigo con mi maldita duda. ¿De tu o de usted? ¿Donde lo cambio? Mañana toca revisarlo si o si. Eso, y sacar el release, porque ya está casi listo.

Vamos a por las estadisticas: dos sesiones: lineas 299-576, una hora y 29 minutos, lineas 577-716, 39 minutos.

El capitulo tiene 805 lineas, así que el release es mañana. Lo que si aviso es que el primer capitulo es la mitad de un arco (el segundo capitulo es continuacion del primero).

Mañana, id preparandoos.

Un saludo.

jueves, 22 de octubre de 2015

Proyecto WNKNT: Dia 1

Veamos el primer resumen diario. He tenido un pequeño problema con el archivo de video y he debido recodificarlo a otro formato. Vosotros no tendreis problemas seguramente, pero me causaba una desincronizacion de audio y a la hora de ajustar si la voz era de hombre o de mujer y la entonacion era un problema.

Tras una reflexión, he decidido seguir las siguientes pautas en cuanto a los tratamientos:
- Al principio, ella y el se llaman de usted. En el momento en que a ella pierde el control, pasan a tutearse.
- He traducido Ms. Landlord como "señorita propietaria". Tiene también cierto tono de mofa.
- El llama por lo general a sus clientes de usted, y estos a el tambien. Existen excepciones, por ejemplo cuando hay diferencias de edad.
- Los policias llaman a los protagonistas de tu, y estos tambien a su vez.
- He restaurado los -san en donde pone Mr o Mrs en los subtitulos originales.
- He castellanizado determinadas expresiones de la traduccion.
- En cambio, hay muchas expresiones en japonés que se mantienen en el subtitulo en inglés (p.ej. otsukaresama). Las voy a mantener. Si el traductor las dejó así, por algo será.

Vamos a por las estadisticas: He hecho dos sesiones: las lineas 1-156 en 51 minutos y las lineas 157 a 298 en 36 minutos (3.43 lineas por minuto). Entre las distintas correcciones, la recodificación y todo eso, me ha salido una velocidad decente. Segun vaya metiendo palabras en el corrector ortografico esto se acelerará.

Proyecto Watashi no kirai na tantei

Hoy comienzo con un nuevo capitulo de traducción, de la serie Watashi no kirai na tantei. Se trata de una serie de comedia de un detective con bastante talento pero mas interesado en el dinero que en los propios casos y una estudiante universitaria muy adinerada con excesivo entusiasmo por los misterios pero poca cordura.

Vamos a por la descripcion de la serie. Está formada por ocho capitulos de 45 minutos cada uno y unas 850 lineas. A 300 lineas por dia, me salen tres dias por capitulo, o 24 dias. Calculando un periodo de "seguridad", calculo que tardaré entre 20 y 30 dias en terminarla.

La serie se distribuye mediante torrent, como siempre. Aqui teneis el magnet:

magnet:?xt=urn:btih:349795E320850F141008DA242133AC117BCF6B4F&tr.0=http://tracker.openbittorrent.com/announce&tr.1=http://exodus.desync.com/announce&tr.2=http://tracker.torrentfrancais.com/announce&tr.3=http://tracker.torrentbay.to:6969/announce&tr.4=http://tracker.prq.to/announce&tr.5=udp://tracker.istole.it:80/announce&tr.6=http://tracker.ex.ua/announce&tr.7=udp://tracker.publicbt.com:80/announce&tr.8=http://tracker.torrentfrancais.com/announce&tr.9=http://tracker.tfile.me/announce

Contiene los ocho archivos en formato Matroska (MKV) y pesan algo menos de 1.5 GB cada uno. No tendreis problemas para descargarlo, ya que tengo nueva conexion de fibra en casa y tengo una velocidad de subida bastante alta.

Esta vez quiero imponer unas normas de distribucion restrictivas. No quiero que me roben los subtitulos, ni que hagan hardsubs. Basicamente serán: si quieres distribuirlo, que no sea con mis subtitulos. Traducetelo tu.

Los subtitulos originales son de www.helloheydays.com.

Para variar, ire notificando aqui los resultados del dia y cuando sale cada capitulo en Twitter con la etiqueta #WNKNTSubEsp. Podeis seguir tambien la cuenta @acerswap.

Empezamos.

miércoles, 21 de octubre de 2015

Próximos proyectos

Como ya sabeis que si no hago nada suelo aburrirme, pues tengo ya previstos dos proyectos de traducción (y uno mas posible) para los proximos meses.

El primero es Watashi no Kirai na Tantei. Va de un detective privado, movido por el dinero y que huye de los casos de asesinato por ser poco lucrativos que alquila una oficina a muy bajo precio a una universitaria loca por las series de TV de crimenes y los misterios. ¿Sabeis lo de la "navaja de Ockham" (en igualdad de condiciones, la explicación más sencilla suele ser la más probable)? Pues a la chica no. Es una serie divertida (llevo ya tres capítulos vistos) y creo que os puede gustar. Aqui teneis el cartel:


Son ocho capitulos de 45 minutos cada uno. Serie cortita.

A proposito, por si os suena la cara y no ubicais al actor, es Chiaki, el protagonista de Nodame Cantabile.

El siguiente proyecto se llama Keibuho Sugiyama Shintaro. En este caso es un policía que queda viudo y tiene que hacerse cargo de su familia. Solo he visto el primer capitulo por el momento, pero tiene muy buena pinta. El cartel es este:


Tambien son capitulos de 45 minutos. En este caso son 11 capitulos, pero el primero es el doble de largo.

El otro medio proyecto es una serie antigua (¡de 1998!) sobre oficinistas llamada Shomuni, con varias temporadas, pero que precisamente por eso me va a costar conseguir las raws y los softsubs de todo el material. Por si fuera poco, a diferencia de las dos anteriores existen paginas de videos con hardsubs que ya tienen creada la ficha en su catalogo (supongo que a la espera de tener algun sitio de donde robarla) y, si os digo la verdad, tengo muy pocas ganas de hacer un esfuerzo traduciendo para que otros se lleven un merito, unas visitas, unos comentarios y un dinero a mi costa. Aunque Trick era del 2000, no estaba basada en un manga y por eso la popularidad era menor. Por eso no la pongo como "futuro proyecto" sino como "posible".

Acerca de la complejidad de los proyectos, mientras que el segundo no tiene problemas de traducción (es una serie para toda la familia y usa lenguaje sencillo), en los otros si me va a costar mas.

En Watashi no Kirai na Tantei aparte de usar en la versión en inglés abundantes terminos sin traducir me encuentro con el problema de si se hablan de tu o de usted. Mientras que la chica admira al detective, lo que podría llevar a que le tratara de usted (tambien es mayor que ella), es su casera, asi que llamarle de tu no queda tampoco como algo a descartar. Con el detective lo mismo, la chica es mas joven, pero tambien es su casera.

En Shomuni el problema está tambien en el tratamiento. La serie al ser tan antigua, asi como los subtitulos incita a traducirla hablando de usted hasta al gato.

Estos son en principio los proyectos que tengo previstos. En un par de dias comenzaré con el detective y la metomentodo, cuando haya organizado mi matricula de la universidad y se me haya quitado un dolor de cabeza que me atormenta estos dias (maldito clima, maldito resfriado).

¿Que opinais? ¿He elegido bien los proyectos? ¿Los seguireis? ¿Teneis alguna serie por ahi que pueda ser mas interesante? Podeis comentar lo que querais.

Un saludo.

lunes, 19 de octubre de 2015

Aprendiendo informática: Formatear

Anteayer una amiga me hacia una consulta y me ha inspirado para hacer el post de hoy. Al parecer, llevó un pendrive con datos a imprimir a una tienda y cuando se lo devolvieron habia una carpeta con el nombre "cuarentena" en su interior. Esto la hizo sospechar que pudiera tener un virus, asi que me pidio ayuda para desinfectarlo. Yo le contesté que la mejor manera era formatearlo y como ella tiene un Mac, tuvimos que consultar la forma de hacerlo en su sistema. Poco después me preguntó extrañada, ¿es normal que ponga que le faltan 40 minutos? Por lo visto, los Mac incluyen por defecto un sistema de borrado seguro en la opcion de formateo y ella había marcado la opción 3 de 4 dentro de los niveles de seguridad. A todo esto, recordé que mucha gente no sabe lo que es el formateo realmente, asi que os lo voy a explicar hoy.

Como siempre, la explicación pretende ser comprensible y no exacta, asi que si quereis informacion detallada y completamente correcta no la encontrareis aqui.

Seguramente hayais oido esa palabra, formatear, y la hayais asociado a "borrar el disco". En realidad no es lo mismo, sino que el formateo tiene como consecuencia el borrado del acceso a los archivos.

En principio, un disco duro, una cinta magnetica o un disquete son solo una superficie recubierta de particulas magneticas que se pueden recolocar. No se guardan los archivos tal cual, sino que hay una estructura de datos que hay que respetar, y a esta se le denomina "formato".

La forma mas simple que podemos pensar ahora mismo es un formato de tabla de localización de archivos. Este sistema se basa en grabar lo siguiente en el disco, empezando desde un punto predeterminado (el que llamaremos "sector de inicio"):

1. Cierta información sobre el tamaño del disco y sobre el formato que se usará.
2. Una tabla que asocia el nombre de un archivo con su posición en el disco.
3. La parte del disco que almacena los datos.

Cuando se quiere acceder al contenido de un archivo, se comprueba en esa tabla en que posición está ese archivo y se lee. Hasta aqui bien, pero ¿quien se encarga de "inicializar" ese disco? A esa operación se le llama "formatear". Es, en definitiva, crear esa tabla y dejarla en blanco. Es imprescindible realizar esa operación al usar un nuevo disco, aunque los discos externos vienen siempre formateados, los disquetes tambien, los pendrives mas de lo mismo y los programas que particionan los discos duros (otro concepto interesante) los suelen formatear al crear las particiones.

Como es lógico, al dejar esa tabla en blanco, el disco duro está aparentemente en blanco y puede ser escrito, aunque en la parte que almacena los datos haya información.

Ese formateo puede realizarse de dos modos, el modo "rápido" y el modo "normal". En el modo normal, se examina el disco para buscar si hay alguna parte dañada, luego se escribe la tabla y se marcan las partes dañadas como "inutilizables". En el modo "rapido", se escribe la tabla como si el disco no tuviera partes dañadas. Si en algun momento el disco detecta un error, se marcará en la tabla de todos modos. En realidad, el modo normal da una mejor información sobre el tamaño utilizable del disco y en caso de que tenga una gran parte dañada acelera la escritura (ya que se sabe donde están los daños exactamente.

¿Y que hay de los modos adicionales?

Como ya habiamos comentado, el formato no elimina los datos del disco, solo la tabla. Eso permitiria a alguien con las herramientas necesarias (desde programas especificos a microscopios electronicos) recuperar los datos que habian sido grabados. La solución: borrar también esos datos grabados escribiendo otra cosa encima.

El sistema mas simple, escribir "ceros" en toda la superficie. No es infalible, pero si requiere mas tiempo y unas herramientas mas potentes para recuperar esos datos (la grabación magnetica no es tan simple como unos y ceros). Esta operación se puede realizar escribiendo primero ceros, luego unos, luego ceros de nuevo, y asi en repetidas ocasiones. Cuantas mas "pasadas" se realicen, mas dificil será recuperar esos datos.

Otro sistema, mas seguro es escribir datos aleatorios en cada pasada. En el caso de que se intenten recuperar datos solo se recuperarán datos inservibles. Tras varias pasadas es mucho mas dificil reconocer datos "legitimos" de datos "basura".

Bueno, esto es el formateo. Volvemos con mi amiga. ¿Que clase de formateo necesitaba realizar para eliminar su virus? Cualquier clase de formateo le habría valido. No se trata de un pendrive dañado, con lo que un formateo rápido debería bastar. Tampoco se trata de eliminar datos por seguridad, así que los formateos "seguros" no son necesarios. La unica consecuencia que ha tenido es que ha tardado cuarenta minutos en realizar una operación que podía haber realizado en dos minutos (máximo).

Sabiendo esto, ya no cometereis el mismo error de confundir formatear (inicializar) un disco con borrarlo.

Un saludo.

domingo, 11 de octubre de 2015

Publicacion de mis subtítulos en otras páginas (IV)

Por fin tengo algún tipo de "respuesta". El administrador de la pagina ha hecho ademán de comunicarse conmigo mediante facebook.

Me han llegado unos mensajes que paso a citar (en gris):

- hola amigo

- que tal

- soy el dueño

- xk no te unes

Y mis respuestas (en verde):

- hola

- ¿a que te refieres con que me una?


(10 minutos en blanco, esperando respuesta)

- ¿a que te refieres con que me una? ¿a la pagina de facebook?


No me quedan claras sus intenciones, si quiere que me una a su grupo de facebook, como colaborador de su página o que es lo que me sugiere. En cualquier caso, mis intenciones iniciales son las mismas: que retire mi material actual y futuro de su página, puesto que me puede acarrear problemas legales.

Mas información, cuando la haya.

Un saludo.

sábado, 10 de octubre de 2015

Nuevo seguidor

En mi panel de control del blog me acaba de aparecer que tengo un segundo seguidor. Quería darle desde aquí la bienvenida.

Un saludo, y espero que te diviertas y aprendas mucho.

Publicación de mis subtítulos en otras páginas (III)

Ha pasado ya una semana desde que me puse en contacto con e..z solicitando la retirada de mis subtítulos de d..s y no he obtenido respuesta ni he visto que haya tomado ninguna acción. Por eso mismo, he enviado un mensaje al administrador de d..s mediante facebook con el siguiente texto:

Hola

Soy el traductor de la version de Legal high 2 que hay subida a d..s.

Por lo visto el uploader, e..z, ha subido una versión en hardsub de mis subtítulos a pesar de que indico expresamente que no autorizo a que se publiquen fuera de mi blog y menos aun en formato hardsub.

Por esta razón, quería pediros que retirarais esa versión de vuestra página.

Un saludo

I..z (acerswap)

Por el momento voy a seguir manteniendo en privado la identidad de la página y del uploader. Dependiendo de lo que ocurra en los próximos siete días decidiré si hago publico el nombre de la página y del uploader.

Un saludo, y ya sabeis que os mantendré informados.

sábado, 3 de octubre de 2015

Publicación de mis subtítulos en otras páginas (II)

Hoy haciendo un barrido en Google para ver si mis subtítulos se han distribuido sin control me he llevado la desagradable sorpresa de ver una copia en hardsub de Legal high 2 en una página de streaming (a la que me referire como "d..s"). Como ya sabeis, en todas mis traducciones indico que no quiero que se distribuyan en forma de hardsub.

He decidido solicitar, por las buenas, la retirada de esos subtítulos. He localizado a través de la página al uploader (al que me referire como "e..z") y afortunadamente le he encontrado a través de un foro con el que ya tuve problemas (al que me referiré como "l..b").

Le he escrito un mensaje privado, que paso a citar:

Buenos dias, e..z

Soy acerswap, traductor de la serie Legal high 2 al castellano. Acabo de ver que has subido una versión hardsub de mis subtítulos a d..s. Tengo que pedirte que retires esa subida de la página y de todas en las que lo hayas subido. Que mi nick aparezca en un hardsub me puede traer problemas legales, aparte de que lo solicité expresamente en los términos de distribución.

También te pido que si sabes de alguna otra página que contenga esa versión, me lo indiques para que pueda solicitar su retirada al uploader o a la página correspondiente.

Un saludo.

En un par de dias, mirare si ha sido retirado el video o si recibo algún mensaje a través de l..b. Os mantendré informados.

Un saludo

viernes, 2 de octubre de 2015

Aprendiendo informática: OCR - Resultados AviSubDetector

Ya que ayer vimos como se usa AviSubDetector, vamos a comprobar los resultados que nos han salido al usar nuestro juego de pruebas.

Para ello, realice las pruebas hace un par de dias, antes de la escritura del tutorial, con las mismas opciones que mostré.

Si hay algo que se observa de manera mas que evidente en cuanto abres el archivo es la precisión a la hora de calcular la temporizacion. La tasa de error es como mucho de 4 centesimas de segundo.

Otra cosa que se percibe es que aunque existen lineas que se salta, cosa que también sucede con SubRip. A cambio, existen lineas que duplica, posiblemente en cambios de escena, pero están correctamente sincronizadas para que no haya saltos.

Se da tambien el problema de las comillas y el apostrofe, pero es común a ambos programas. Este tampoco cae en ninguna de las trampas, lo que me hace pensar que han sido demasiado sencillas. Lamentablemente, la linea con la cursiva se la saltó entera, así que no pude probarlo. Para el próximo juego de pruebas pondré una o dos lineas completas.

El tiempo que se tarda es bastante menor, cerca de unos cinco-ocho minutos, y la precisión es buena. En SubRip existen frases ininteligibles, mientras que aquí el fallo es menos acusado.

En cualquier caso, ya sabeis que me gusta dejaros las pruebas para que las realiceis si quereis en casa.

En este enlace están los resultados de la prueba sin modificar: https://app.box.com/s/oaj8jhg7q777jnv47crg90xwh6d89m4g

En este otro, la comparativa entre la versión original (en la parte superior) y la transcripción: https://app.box.com/s/o9br2fal0rynqztsnwh8pgnte1yu0qux

Con esto, en principio, finaliza el proyecto OCR (aunque no descarto añadir algo mas adelante). Un saludo y no olvideis pasar por aqui cada cierto tiempo para ver si he comenzado con alguna nueva traducción o algun tutorial.

jueves, 1 de octubre de 2015

Aprendiendo informática: OCR - Introducción a AviSubDetector

Hoy voy a mostraros el funcionamiento de AviSubDetector. Es un programa infinitamente mas complejo que SubRip, e inicialmente fue ideado para detectar en que frames hay un subtitulo, su posición y el instante de tiempo en que aparece. La opción de OCR aún es experimental, aunque funciona realmente bien. No conozco apenas el programa, pero os puedo mostrar los elementos básicos.



En la ventana que sale nada mas abrir el programa observamos la opcion OCR en la parte superior, una barra de desplazamiento. Todas las opciones están dentro de las pestañas inferiores, no en los menús, así que vamos a examinarlas.


Como en el otro programa, existe la posibilidad de recortar la imagen para seleccionar la zona que contiene los subtítulos. Existe la posibilidad de seleccionarlo como 1/2, 1/3, 1/4 o 1/5 de la pantalla o hacerlo a mano. En mi caso he seleccionado en la sección "Crop" (recortar) los porcentajes Top (87%) y Bottom (1%) para encuadrarlo.



La siguiente parte que veremos está en la pestaña OCR (que también tiene mas pestañas dentro). En la sección Auto-search podemos seleccionar si la conocemos la fuente (el tipo de letra) en que están nuestros subtítulos. También seleccionaremos las letras que queremos que busque por defecto, si queremos buscar letras en cursiva y algo que parece una tontería, pero que en realidad no lo es: el orden de la búsqueda. El programa inicialmente compara la letra que lee con las que conoce. Una vez coincide, la escribe y pasa a la siguiente. En ese caso, si aparece en la lista que debe buscar primero la letra u y luego la ú, detectará la letra u e ignorará el acento. Podemos quitar y añadir letras si queremos.

Inicialmente esto no es necesario, ya que si no encuentra la letra lo que hará es pedirnos que la introduzcamos a mano, pero es una forma de facilitarle el trabajo. La velocidad y la precisión aumentan de una manera sorprendente, asi que nos conviene seleccionar una fuente y si no conocemos cual es al menos una similar.

Presionamos el botón de Start (Full) y nos encontramos con esta nueva ventana:


En la parte superior vemos la linea que está analizando, con un recuadro blanco los subpictures y recuadrado en negro el subpicture que se está comprobando. Encontramos tres imagenes debajo. La izquierda se corresponde con la nueva letra que introducirá en la matriz de simbolos. En la parte central, el símbolo que ha encontrado mas parecido, y a la derecha una superposición entre ambos, para mostrar por que los ha encontrado parecidos. Debajo de las imagenes hay una casilla en la que introducir el caracter correspondiente, si está en cursiva, negrita o subrayado. Los botones inferiores nos permiten (en este orden) agregarlo a la matriz de simbolos, escribirlo a mano sin agregarlo a la matriz, eliminar el símbolo existente por ser erroneo o ignorar lo que ha encontrado por ser un falso positivo.

En cuanto al botón siguiente, "Use full rect" es algo que le falta a SubRip. Observad la siguiente imagen:


Si os fijais, ha detectado la mitad de la i, dejando el punto fuera. En cambio ha detectado un posible subpicture que lo incluye. Es posible indicar que debe analizar el subpicture exterior, incluyendo el palito y el punto de la i. Presionamos el boton y como veis se selecciona la i por completo. Es posible que nos vuelva a pedir confirmación, pero no es necesario cambiar nada mas.


Como veremos en la siguiente captura, se ha ido creando la matriz de simbolos (como las capturas las he realizado al poco de empezar, aparece casi vacía. Esta en la pestaña "Symbols". NOTA: no siempre permite cambiar la pestaña una vez comenzada la transcripción, con lo que es recomendable que si quereis ver la matriz entreis en la pestaña antes de iniciar la transcripción.


En la parte inferior, junto a la barra de progreso de la linea vemos como va reconociendo los caracteres en tiempo real. En caso de que no reconozca un caracter, lo sustituirá por #. En el caso de saltos de línea, por |.

Ocurrirá también que examinará varias veces algunas lineas, sobre todo si aparecen en un cambio de escena. Si detecta erroneamente la linea, creará una linea duplicada.

Ahora quiero mostrar un par de casos especiales:


Este primer caso muestra dos elementos, el primero es una detección erronea en el acento. A veces sucede que detecte el acento como una coma, pero si aparece dentro de un subpicture "ampliable" no hay problemas. En la misma captura podemos ver que hay veces que detecta subpictures con dos letras, el "fo" que se muestra es un ejemplo.Tambien se pueden introducir varias letras.

El último caso es el de los "positivos fantasma". Mirad esta captura:


El subpicture activo que se muestra es un palito en la parte superior izquierda. Ahi no hay ningun caracter. No os despisteis, aunque haya una i en la linea debeis decirle que ignore ese caracter.

Al terminar e ir a cerrar el programa os dara la opcion de salvar el subtitulo. Podeis salvar también la matriz de símbolos, per no es necesario.

En principio eso es todo. Ya sabeis lo suficiente para hacer vuestras pruebas. Mañana analizaré los resultados y quizás haga una comparativa.

Un saludo.