di: Claudio Garau 27 Febbraio 2009
Con il termine "carattere" si intende indicare l'elemento più piccolo che compone un linguaggio scritto dotato di valore semantico, un charset è invece un gruppo di caratteri in codice standard legati alla trasmissione di informazioni, come per esempio l'alfabeto latino.
I gruppi di caratteri codificati sono dei set nei quali ad ogni carattere viene associato un valore scalare detto "point code", i set UNICODE e ASCII sono per esempio dei gruppi codificati che utilizzano un proprio sistema per associare valori differenti e univoci a specifici caratteri; la consonante minuscola "d" corrisponde per esempio al valore scalare "100" in codice ASCII (American Standard Code for Information Interchange o Standard americano per lo scambio di informazioni).
Un carattere codificato, indipendentemente dallo standard di riferimento, necessita di essere decodificato per poter essere utilizzato; in ambito informatico, un carattere codificato deve essere convertito in una corrispondente rappresentazione digitale, ciò vuol dire che il metodo di decodifica impiegato dovrà consentire la traduzione di ogni valore un una corrispondente sequenza di byte
PHP è un linguaggio che mette a disposizione alcuni strumenti per la gestione dei set di caratteri, nel corso di questa breve trattazione verranno descritte le caratteristiche più importanti di questi costrutti.
L'UNICODE (noto anche come Universal Character Set) è un sistema per la codifica dei caratteri che associa un valore univoco ad ogni carattere utilizzato per la stesura di testi, indipendentemente dalla lingua, dal sistema operativo e dall'applicazione di riferimento; esistono differenti tipologie di codifica per lo standard UNICODE: UTF-8, UTF-16 e UTF-32, dove UTF significa Unicode Transformation Format mentre il numero seguente indica la quantità di bit associata alle sequenze numeriche.
UTF-8, altamente compatibile con i set di caratteri ASCII, è il sistema di codifica multibyte più diffuso per le applicazioni Web based. Si fonda su un'architettura a 8 bit per l'encoding e associa ad ogni valore scalare UNICODE una sequenza di byte in numero oscillante tra 1 e 4. Naturalmente, nel caso in cui si sviluppino applicazioni Web based, uno degli argomenti più rilevanti è quello relativo alla manipolazione delle entità HTML.
PHP mette a disposizione due funzioni native che permettono la traduzione di specifici caratteri nelle corrispondenti entità HTML, queste funzioni sono htmlspecialchars() e htmlentities(); inoltre, è disponibile per l'utilizzatore la funzione html_entity_decode() che permette al contrario la decodifica delle entità HTML nei relativi caratteri. Tutte e tre le funzioni appena citate vengono utilizzate largamente in sede di sviluppo di applicazioni destinate ad Internet, però, forse non tutti sanno che questi costrutti si basano su specifiche mappe di entità (disponibili in un'apposita sezione presente sul manuale ufficiale di PHP) a seconda del set di caratteri di riferimento.
Guida Yii FrameworkCome creare applicazioni Web in modo semplice e veloce con il... |
Guida Zend FrameworkDiventate professionisti dello sviluppo Web. Zend Framework è lo... |
Guida Applicazioni Facebook con PHPCome realizzare un'applicazione per Facebook. Dalle basi della... |
Ogni lunedì, direttamente nella tua e-mail: script, articoli, guide e tutorial su PHP, MySQL e Apache.
Iscriviti alla newsletter
|
|
Corso PHP per Webmaster11 Giugno 2012 a Milano |
|
|
Corso Google AdWords Base25 Giugno 2012 a Milano |
|
|
Corso Google AdWords Base05 Giugno 2012 a Roma |