-
Notifications
You must be signed in to change notification settings - Fork 390
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
script to search for and complete probable 'index entries' #2706
Conversation
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
@cacrespo gracias por este nuevo script! No lo he probado, pero ya leyendo el código te dejo algunos comentarios que ojalá ayuden a organizar un poco mejor las cosas
Hola @cacrespo ! No vi el script en detalle, pero tengo algunos comentarios:
|
Gracias por los comentarios @mmmarcos. Van mis dos centavos, a ver qué te parece: 1_ Tomo el mismo ejemplo de la traducción francesa: fijate que tenés méthode, méthode magique, etc. pero después quedan varios method, methods, methodxxx, method_xxx, etc. Algunas se van a poder traducir, otras son clases y obviamente no; pero quedan todas más o menos juntas. Ahora bien, si fuera otra palabra (por ejemplo 'Función incorporada' por 'Built-in function') hay chances que algunos links queden en la letra "B" y otros en la "F". Esto es lo que me da la impresión que termina siendo perjudicial porque tenés conceptos similares en distintas partes de todo el índice. A partir de ahí es que llego a la conclusión de que tal vez para esta sección es mejor sacrificar traducción para mantener consistencia. Sobretodo pensando en cómo se utiliza un índice :P 2_ Me imaginaba el caso hipotético de alguien que se lleva el file a otra carpeta y hace el trabajo de forma "aislada". De modo, que opté por descartar la idea de vincular el procedimiento a cualquier otra cosa que no sea el propio ¿Te convence? |
Muy cierto! creo que en algún momento tuve la misma duda con las entradas que no empiezan con la misma letra (me debo haber olvidado ^^). En este sentido eran mas prácticas las instrucciones de Sphinx específicas a Python (module, class, ...) porque se podían traducir automáticamente, ahora con los index de tipo +1 por tu propuesta!
Convencido! 👍 |
He vuelto! 🎈 No me convence mucho el hecho que aplique .save() a todos los files que se iteran. Con idenpendencia si se ajustó o no alguna linea. De hecho todo este bloque me parece que se ve "feo".
¿qué les parece? |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
@cacrespo se ve súper bien, gracias por tomar a cuenta los comentarios! Queda un par de detalles, pero después de resolverlos ya creo que queda todo bastante bien.
Apply suggestions from @rtobar
@rtobar Impacté las recomendaciones y sumé un pequeño ajuste visual. A diferencia de la versión anterior, ahora le pasamos a la función |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
¡Perdón @cacrespo por la demora nuevamente! Te dejo un solo comentario más y ya y lo mergeamos, ¿qué te parece?
Otra cosita más: acabo de darle una prueba al script ejecutándolo sobre los contenidos de
(antes de hacer powrap la estadística final decía Al ir por el diff mismo se hace más obvio cuáles son entradas del índice y cuáles no. Así que igual creo que usar el script sirve. Yo esperaba que quizás la heurística iba a ser suficiente como para hacer un commit con todos los cambios que encontrara, pero claramente no es así, y va a ser necesario ir manualmente verificando los resultados. ¿O quizás hay algún otro patrón que no hemos encontrado? |
Co-authored-by: rtobar <[email protected]>
@rtobar impactados los ajustes!
Lo noté... 👎 Aproveché y le cambié el ancho a la hora de cargar los pofiles ya que por lo que vi usamos 79 (y polib setea 78 por defecto). |
Me quedé pensando en esto...
Pienso que una regla adhoc podría ser el largo de las entradas. Se supone que un índice tiene entradas cortas. Tal vez podríamos añadir una regla del tipo si la entrada > xxx caracteres es porque no es índice. Pero lo siento muy forzado. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
@cacrespo gracias por atender al último set de comentarios que envié, y perdón por la nueva demora!
Estoy de acuerdo contigo que forzar un máximo de caracteres en las entradas como parte de la heurística para dar con las entradas del índice global es un poco forzado. La idea es igual que usemos este script para lidiar con la mayor cantidad de estas entradas, pero de seguro que vamos a tener que hacerlo con cuidado y mirando el output de cada archivo.
Voy a aprobar estos cambios, y mergear ya a 3.12. Y ahora que tenemos este script a disposición: ¡hay que usarlo!
Si trabajamos con el
.po
directo no es sencillo identificar aquellas entradas que están vinculadas con la contrucción del índice general (y no con la página específica que se está traduciendo) . Acá más contexto.Dado que mayormente son nombres de funciones, clases, etc. una de las propuestas es mantener el índice sin traducir y asegurar consistencia en los conceptos.
Este script toma un
.po
específico (o varios) y recorre una a una las entradas, identifica posibles entradas de índice -a partir del orden en el file- y ofrece completar la traducción con el mismo contenido que el original.