XML per la conversione ASCII

October 29

Un vantaggio principale di XML è che permette di codificare i dati e l'uscita (o trasformare) contenuto di un elemento in uno qualsiasi di un certo numero di formati, tra cui testo semplice (ASCII). Mentre questo può essere fatto di programmazione, XSL trasformazione è progettato specificamente per questo scopo. Le principali sfide nella creazione di una conversione perfetta sono due: ottenere i dati corretti dal documento XML-tag; e la gestione dei caratteri speciali.

XML Schema

XML è, per definizione, informazioni strutturate. Molti documenti XML definiscono uno schema formale che descrive come gli elementi XML possono essere utilizzati. In effetti, lo schema agisce come una tabella di marcia per il documento XML. Quindi il primo passo è quello di analizzare lo schema e mappare gli elementi alle loro controparti ASCII. Questa può essere una semplice questione di tirare dati direttamente dal contenuto di un elemento. Essere consapevoli, tuttavia, che gli attributi di un elemento possono contenere anche dati critici, come ad esempio un numero record di database che deve essere incluso nella conversione.

Schema implicita

Quando viene fornito alcun schema convenzionale, la struttura del documento XML è ancora implicita. Questo rende possibile ricostruire lo schema. Una buona strategia in questo caso è quello di esaminare gli elementi all'interno della vostra istanza del documento e scrivere uno schema che gestisce tutte le istanze nel documento.

Set di caratteri

Ci sono molti set di caratteri per coprire i caratteri speciali utilizzati nelle diverse lingue in tutto il mondo. Il set di caratteri ASCII specificamente fa riferimento il testo per la lingua inglese. Secondo Richard Ishida del World Wide Web Consortium ", il set di caratteri Unicode contiene caratteri per la maggior parte delle lingue viventi e gli script in tutto il mondo." (Http://www.w3.org/International/getting-started/characters.) Per evitare possibili problemi, una buona pratica è quella di utilizzare la codifica UTF-8 set di caratteri Unicode quando si effettuano le conversioni.

Entità

XML definisce un piccolo insieme di caratteri, chiamato entità predefinite. Queste entità sono i caratteri per il commerciale e il punto e virgola, che hanno usi specifici in XML e sono quindi limitati. Per aggirare il problema, è necessario sfuggire a questi personaggi. Ad esempio, è necessario utilizzare "& amp;" per rappresentare il carattere commerciale in XML. Essere a conoscenza di questi e di altri caratteri di escape speciali nei dati.