Пространства от имена

Действия на страницата

Системи за кодиране и необходимостта от класификация възниква от необходимостта от записване, маскиране, подреждане, идентифициране, групиране и класифициране на явления и от улесняване на тяхното регистриране и предаване. Примери: Морзови кодове, ключови записи, класификационни кодове на библиотеки, кодове на продукти и др.

система

Обобщение

  • 1 Еволюция на кодиращите системи
  • 2 Многобайтова система
  • 3 Версии от този тип кодиране
  • 4 Цели на кодовете
  • 5 Характеристики на кодовите системи
  • 6 Видове кодиране
    • 6.1 Значително
    • 6.2 Не е важно
  • 7 Източници

Еволюция на кодиращите системи

Разпространението на информатиката в нелатинските коренови култури бързо разкри, че 256 знака са недостатъчни, за да съдържат графиките на всички езици. Например кирилица; иврит; арабин; гръцките и японските, за да назовем само няколко. Необходимостта от система с повече от 256 възможности стана очевидна, което доведе до създаването на системи за кодиране, при които всеки знак заема повече от един октет (поне определени знаци), поради което тези системи са познати като общи с широки символи. Приетото решение се състои от две големи групи: многобайтова система (§2) и широка символна система (§3), от които има различни разновидности. Обикновено първият се използва за външно представяне (съхранение) и комуникации, докато вторият се предпочита за вътрешни представителства.

Многобайтова система

Ако става въпрос за представяне на набори с повече от 256 знака във външни хранилища или в преносни системи, при които икономията на пространство и/или честотна лента е важна, решението е да се използват многобайтови системи за кодиране. Известен съкратено като MBCS („Многобайтов набор от символи“).
Както показва името му, те използват повече от един октет, но ширината на различните знаци е променлива според нуждите на момента. Многобайтовите символи са амалгама от едно- и двубайтови символи, които могат да се считат за супермножество от 8-битови ASCII. Разбира се, конвенция от този тип изисква поредица от правила, които позволяват анализ ("Анализиране") на низ от байтове за идентифициране на всеки знак.

Версии на този тип кодиране

  • JIS (японски индустриален стандарт). Използва се главно в комуникациите, например имейл, защото използва само 7 бита за всеки символ. Използва изходни последователности за превключване между едно- и двубайтови режими на символ и за превключване между различните набори от символи.
  • Shift-JIS Представен от Microsoft и използван в системата MS-DOS, системата поддържа най-малкото знаци. Всеки байт трябва да бъде анализиран, за да се види дали е знак или първият от дует.
  • EUC (разширен Unix код). Тази система се използва като метод за вътрешно кодиране на повечето платформи на Unix. Той приема символи, по-дълги от два байта, така че е много по-разтегателен от Shift-JIS и не се ограничава до кодиране на японски език. Той е много подходящ за работа с множество набори от символи.
  • UTF-8 (формат за преобразуване на Unicode). В тази система всеки знак е представен от последователност от 1 до 4 байта, въпреки че в действителност броят на битовете, предназначени да представляват знака, е ограничен до максимум 21 (останалите са метаданни - информация за информация -). Целта на тези метаданни е, че последователността може да бъде интерпретирана от всяка позиция.

Цели на кодовете

  • Улесняване на обработката.
  • Позволете недвусмислена идентификация.
  • Разрешаване на класификацията.
  • Разрешаване на извличане на информация или местоположение.
  • Направете възможно установяването на връзки между различни кодирани елементи.
  • Улесняват маркирането на определени свойства на кодираните елементи.

Характеристики на кодовите системи

  • Той трябва да бъде логически адаптиран към информационната система, част от която е.
  • Той трябва да има точност, необходима за описване на данни.
  • Тя трябва да се поддържа възможно най-малка.
  • Трябва да позволи разширяване.
  • Трябва да е лесен за използване.
  • Те трябва да отговарят на изискванията на оборудването

Типове кодиране

Когато говорим за кодиране на знаци в изчисленията, ние се позоваваме на метода, който позволява преобразуване на символ от естествен език (азбука или сричка) в символ от друга система за представяне, например в число, последователност от електрически импулси в електронен система, октети, прилагащи стандарти или правила за кодиране. Това, за да се улесни съхранението на текст в компютрите или да се улесни предаването на текст чрез телекомуникационни мрежи, може да бъде много прост пример за морзовата азбука

Има два основни типа кодови системи: значими кодове и незначителни кодове.

Значителен

Както показва името му, те са тези, които предполагат значение, тоест отразяват в по-голяма или по-малка степен характеристиките на обекта, предмета или индивида, на който е присвоено.

Незначителен

Понякога наричани последователни или последователни) по никакъв начин не описват обекта, към който са приложени, а са прости етикети, с помощта на които обектът се отличава от другите.

Има голямо разнообразие от методи за кодиране, които са класифицирани според символите, които използват:

В общ смисъл азбучните и буквено-цифровите кодове са ефективни, когато става въпрос за прости кодировки, без много класификации и с малък брой игри. Те имат недостатъка, че ограниченият брой букви не позволява голяма амплитуда в класификациите, въпреки че с азбучен знак могат да бъдат класифицирани 26 възможности, което може да намали размера на кода. Те също така позволяват използването на мнемонични ресурси, което може да е необходимо в случаите, когато е необходимо бързо и лесно тълкуване на кода.