Standard Compression Scheme for Unicode

Unicode
Encodings UCS UTF-7 UTF-8 UTF-16 UTF-32 UTF-EBCDIC SCSU Punycode GB18030
Bi-directional text
BOM
Han unification
Unicode and HTML
Unicode and Email

The Standard Compression Scheme for Unicode (SCSU) is a Unicode Technical Standard to reduce the number of bytes needed to represent text, especially if that text uses mostly characters from a small number of Unicode blocks. It does so by dynamically mapping the values in the range 128-255 to blocks of 128 characters. Since most alphabets are in 128 contiguous Unicode codepoints, this allows for 1 byte per character (plus overhead) encoding for many text files. SCSU will also switch to UTF-16 internally to handle non-alphabetic languages.

SCSU is not a resounding success. Few places need to compress enough Unicode text to make it worth using a poorly supported compression scheme. Treated purely as a compression format, it's inferior to most commonly used compression programs for texts over a few kilobytes. It can be used as a text encoding, but it's very hard to handle internally, and the percentage savings between SCSU and UTF-16 or UTF-8 drops after external compression, dramatically in the case of bzip2 and other modern compression schemes. It does have the advantage that SCSU can compress texts that are only a few characters long, whereas most full-scale compressors need a few kilobytes of data to overcome the overhead.

Reuters, the organization that floated the first draft of SCSU, is believed to use SCSU internally.

External links

UTS #6: Compression Scheme for Unicode (http://www.unicode.org/reports/tr6/)

Retrieved from "https://academickids.com:443/encyclopedia/index.php/Standard_Compression_Scheme_for_Unicode"

Categories: Unicode

Navigation

Home Page (http://academickids.com/encyclopedia/index.php)
Art and Cultures
- Art (https://academickids.com/encyclopedia/index.php/Art)
- Architecture (https://academickids.com/encyclopedia/index.php/Architecture)
- Cultures (https://www.academickids.com/encyclopedia/index.php/Cultures)
- Music (https://www.academickids.com/encyclopedia/index.php/Music)
- Musical Instruments (http://academickids.com/encyclopedia/index.php/List_of_musical_instruments)

Biographies (http://www.academickids.com/encyclopedia/index.php/Biographies)
Clipart (http://www.academickids.com/encyclopedia/index.php/Clipart)
Geography (http://www.academickids.com/encyclopedia/index.php/Geography)
- Countries of the World (http://www.academickids.com/encyclopedia/index.php/Countries)
- Maps (http://www.academickids.com/encyclopedia/index.php/Maps)
- Flags (http://www.academickids.com/encyclopedia/index.php/Flags)
- Continents (http://www.academickids.com/encyclopedia/index.php/Continents)
History (http://www.academickids.com/encyclopedia/index.php/History)
- Ancient Civilizations (http://www.academickids.com/encyclopedia/index.php/Ancient_Civilizations)
- Industrial Revolution (http://www.academickids.com/encyclopedia/index.php/Industrial_Revolution)
- Middle Ages (http://www.academickids.com/encyclopedia/index.php/Middle_Ages)
- Prehistory (http://www.academickids.com/encyclopedia/index.php/Prehistory)
- Renaissance (http://www.academickids.com/encyclopedia/index.php/Renaissance)
- Timelines (http://www.academickids.com/encyclopedia/index.php/Timelines)
- United States (http://www.academickids.com/encyclopedia/index.php/United_States)
- Wars (http://www.academickids.com/encyclopedia/index.php/Wars)
- World History (http://www.academickids.com/encyclopedia/index.php/History_of_the_world)

Human Body (http://www.academickids.com/encyclopedia/index.php/Human_Body)
Mathematics (http://www.academickids.com/encyclopedia/index.php/Mathematics)
Reference (http://www.academickids.com/encyclopedia/index.php/Reference)
Science (http://www.academickids.com/encyclopedia/index.php/Science)
- Animals (http://www.academickids.com/encyclopedia/index.php/Animals)
- Aviation (http://www.academickids.com/encyclopedia/index.php/Aviation)
- Dinosaurs (http://www.academickids.com/encyclopedia/index.php/Dinosaurs)
- Earth (http://www.academickids.com/encyclopedia/index.php/Earth)
- Inventions (http://www.academickids.com/encyclopedia/index.php/Inventions)
- Physical Science (http://www.academickids.com/encyclopedia/index.php/Physical_Science)
- Plants (http://www.academickids.com/encyclopedia/index.php/Plants)
- Scientists (http://www.academickids.com/encyclopedia/index.php/Scientists)
Social Studies (http://www.academickids.com/encyclopedia/index.php/Social_Studies)
- Anthropology (http://www.academickids.com/encyclopedia/index.php/Anthropology)
- Economics (http://www.academickids.com/encyclopedia/index.php/Economics)
- Government (http://www.academickids.com/encyclopedia/index.php/Government)
- Religion (http://www.academickids.com/encyclopedia/index.php/Religion)
- Holidays (http://www.academickids.com/encyclopedia/index.php/Holidays)
Space and Astronomy
- Solar System (http://www.academickids.com/encyclopedia/index.php/Solar_System)
- Planets (http://www.academickids.com/encyclopedia/index.php/Planets)
Sports (http://www.academickids.com/encyclopedia/index.php/Sports)
Timelines (http://www.academickids.com/encyclopedia/index.php/Timelines)
Weather (http://www.academickids.com/encyclopedia/index.php/Weather)
US States (http://www.academickids.com/encyclopedia/index.php/US_States)

Standard Compression Scheme for Unicode

External links

Navigation

Search

Toolbox

Personal tools