Saltar al contenido principal
Inicio - Soporte de OCLC

Conjuntos de caracteres válidos para scripts admitidos

La traducción de este sitio web se genera mediante traducción automática. La calidad y precisión de la traducción automática pueden variar significativamente de un texto a otro.

 

Descubra los conjuntos de caracteres válidos para los alfabetos no latinos admitidos en el administrador de registros.

Árabe, CJK, cirílico, griego y hebreo

Los juegos de caracteres para estos alfabetos se enumeran en Especificaciones de MARC 21 para la estructura de registros, juegos de caracteres y medios de intercambio, tablas de códigos. Estos conjuntos de caracteres MARC-8 son subconjuntos de caracteres Unicode cuyo uso está aprobado en la catalogación MARC 21 . 

Los alfabetos definidos por los conjuntos de caracteres MARC-8 son compatibles con los registros bibliográficos y las variantes de encabezamiento de nombre en los registros de autoridad. 

La siguiente lista define el alcance de los caracteres válidos en las aplicaciones de catalogación de OCLC para los alfabetos árabe (incluido el persa), CJK, cirílico, griego y hebreo: 

  • Árabe básico = 33(hex) [ Gráfico ASCII : 3] 
  • Árabe extendido = 34(hex) [ Gráfico ASCII : 4] 
  • Chino, japonés, coreano (EACC) = 31(hex) [ Gráfico ASCII : 1] 
  • Cirílico básico = 4E(hex) [ Gráfico ASCII : N] 
  • Cirílico extendido = 51(hex) [ Gráfico ASCII : Q] 
  • Griego básico = 53(hex) [ Gráfico ASCII : S] 
  • Hebreo básico = 32(hex) [ Gráfico ASCII : 2]  

 Nota: en los registros bibliográficos, la aplicación inserta la notación (3, (4, $1, (N, (Q), (S o (2, respectivamente) en el campo 066 para indicar qué alfabeto(s) se utiliza(n) en un registro. Si se utilizan varios alfabetos, las anotaciones se insertan individualmente, cada una en un subcampo separado c.  

Armenio, bengalí, devanagari, etíope, siríaco, tamil y tailandés

Estos scripts solo se admiten en registros bibliográficos. 

No hay conjuntos de caracteres MARC-8 definidos para armenio, bengalí, devanagari, etíope, siríaco, tamil o tailandés. Además, el Administrador de registros también admite caracteres cirílicos fuera del conjunto de caracteres MARC-8 (en Inglés). OCLC implementó los siguientes códigos de identificación de script para estos scripts en función de las listas de códigos ISO 15924

La siguiente lista muestra los rangos de caracteres Unicode UTF-8 que definen caracteres válidos para estos scripts en el Administrador de registros: 

  • Armn = armenio (rango de caracteres U+0530 a U+058F) 
  • Beng = bengalí (rango de caracteres U+0980 a U+09FF) 
  • Cyrl = conjunto de caracteres cirílicos (fuera del conjunto de caracteres MARC-8 (en Inglés)) 
  • Deva = Devanagari (rango de caracteres U+0900 a U+097F) 
  • Ethi = etíope (rango de caracteres U+1200 a U+1399, U+2D80 a U+2DDF, U+AB00 a U+AB2F) 
  • Syrc = siríaco (rango de caracteres U+0700 a U+074F) 
  • Taml = Tamil (rango de caracteres U+0B80 a U+0BFF) 
  • Tailandés = tailandés (rango de caracteres U+0E00 a U+0E7F) 

 Nota: el administrador de registros inserta armn, beng, cirl, deva, ethi, sirc, taml o tailandés, respectivamente, en el campo 066 de un registro bibliográfico para indicar que se utiliza el alfabeto. Si se utilizan varios alfabetos, las anotaciones se insertan individualmente, cada una en un subcampo separado c. 

Limitaciones en el uso de los alfabetos armenio, bengalí, cirílico (fuera del juego de caracteres MARC-8), devanagari, etíope, siríaco, tamil y tailandés

  • Para exportar registros que contengan alfabetos armenio, bengalí, cirílico (fuera del juego de caracteres MARC-8 (en Inglés)), devanagari, etíope, siríaco, tamil y tailandés, debe seleccionar la opción de juego de caracteres UTF-8 Unicode en:  
    • Preferencias de usuario > Exportando — Registros bibliográficos > General; seleccione el formato MARC21 con UTF Unicode 

Debido a que los alfabetos armenio, bengalí, cirílico (fuera del conjunto de caracteres MARC-8 (en Inglés)), devanagari, etíope, siríaco, tamil y tailandés no forman parte de los caracteres MARC-8, usted no puede exportar ni importar estos scripts utilizando el conjunto de caracteres MARC-8 opción. 
 
Debido a que los caracteres MARC-8 son parte de UTF-8 Unicode, puede exportar o importar de manera segura registros en árabe, CJK, cirílicos, cirílicos (fuera del conjunto de caracteres MARC-8), griegos y hebreos utilizando los formatos MARC-8 o Opción de conjunto de caracteres UTF-8 Unicode. 

  • No se admiten los alfabetos armenio, cirílico (fuera del conjunto de caracteres MARC-8 (en Inglés)), bengalí, devanagari, etíope, siríaco, tamil y tailandés para las variantes de encabezamiento de nombre en los registros de autoridad 

Caracteres no válidos en el administrador de registros

Los caracteres que no estén incluidos en las listas anteriores de caracteres definidos o que no se puedan insertar mediante Insertar símbolo diacrítico no son válidos. Para incluir caracteres no latinos que necesita pero que no son válidos en el administrador de registros, puede: 

  • Ingrese el carácter en el registro, exporte el registro a su sistema local usando el formato de exportación Unicode y luego elimine el carácter antes de procesar el registro en WorldCat. 

O 

  • Ingrese el nombre del carácter entre corchetes, utilizando el estándar Unicode, si está disponible, (p. ej., ingrese [schwa]) o, para los caracteres CJK, ingrese la lectura del carácter (p. ej., ingrese [yin]). 

Como referencia, vea las listas de éxitos Unicode, que tienen un índice de nombres de caracteres. 

Nota: el acceso Z39.50 a los registros de WorldCat también admite los conjuntos de caracteres MARC-8 y Unicode UTF-8. Consulte Z39.50 Cataloging para obtener información sobre la compatibilidad con alfabetos no latinos en Z39.50. 

Los multiscripts en un solo registro son válidos

Utilice tantos alfabetos no latinos admitidos como necesite en cualquier parte de un registro, incluso dentro del mismo campo.