Повна версія

Головна arrow Головна

  • Увеличить шрифт
  • Уменьшить шрифт


<<   ЗМІСТ   >>

Кодування інформації

Для автоматизації роботи з різними даними (числовими, текстовими, звуковими та ін.) Використовується прийом кодування - вираз одного типу даних через дані іншого типу. Так, природний людський мова являє собою систему кодування понять для вираження думок за допомогою мови, система кодування Брайля використовується у сліпих. Різні системи кодування успішно застосовуються в різних галузях техніки, науки, економіки.

Сигнали в комп'ютері передаються за допомогою електричних імпульсів. Щоб розрізняти кожну використовувану цифру десятковоїсистеми, знадобилося б десять різних сигналів.

З технічної точки зору чим менше видів сигналів, тим краще. Тому для електронного обчислювального пристрою ефективніше і зручніше двійкова система кодування - представлення чисел за основою 2, при якому значення виражаються комбінаціями 0 і 1. Простота здійснюваних операцій і можливість здійснювати автоматичну обробку інформації, реалізуючи лише два знака, дають переваги, істотно перевищують недолік у вигляді швидкого зростання числа розрядів.

Кодування чисел

Числову інформацію комп'ютер обробляє в двійковій системі числення. Таким чином, числа в комп'ютері представлені послідовністю цифр 0 і 1, званих бітами (біт - один розряд двійкового числа). На початку 1980-х рр. процесори для персональних комп'ютерів були 8-розрядними, і за один такт роботи процесора комп'ютер міг обробити 8 біт, тобто максимально обробляється десяткове число нс могло перевищувати 111111112 (або 25510). Послідовність з восьми біт називають байтом, тобто 1 байт = 8 біт. Потім розрядність процесорів росла, з'явилися 16-, 32- і, нарешті, 64-розрядні процесори для персональних комп'ютерів, відповідно зросла і величина максимального числа, оброблюваного за один такт.

Використання двійкової системи для кодування цілих і дійсних чисел дозволяє за допомогою 8 розрядів кодувати цілі числа від 0 до 255, 16 біт дає можливість закодувати понад 65 тис. Значень.

У ЕОМ застосовуються дві форми подання чисел:

  • природна форма, або форма з фіксованою комою. У цій формі числа зображуються у вигляді послідовності цифр з постійним для всіх чисел становищем коми, що відокремлює цілу частину від дробової, наприклад +00456,78800; +00000,00786; -0786,34287. Ця форма незручна для обчислень і застосовується тільки як допоміжна для цілих чисел;
  • нормальна форма, або форма з плаваючою точкою. У цій формі число виражається за допомогою мантиси і порядку як N = ± Μ • Р ± r, де Μ - мантиса числа (| M | <1), r - порядок числа (ціле число), Р - основа системи числення. Наведені вище цифри в нормальній формі будуть представлені як +0,456788 • 103, +0,786 • 102, -0,3078634287 • 105.

Нормальна форма подання забезпечує великий діапазон відображення чисел і є основною в сучасних ЕОМ. Всі числа з плаваючою комою зберігаються в ЕОМ в нормалізованому вигляді. Нормалізувати називають таке число, старший розряд мантиси якого більше нуля.

У пам'яті ЕОМ для зберігання чисел передбачені формати: слово - довжиною 4 байта, півслова - 2 байта, подвійне слово - 8 байт.

Розрядна сітка для чисел з плаваючою комою має наступну структуру:

  • • нульовий розряд - це знак числа;
  • • з 1-го по 7-й розряд - записується порядок в двійковому коді;
  • • з 8-го по 31-й - вказується мантиса.

Кодування текстових даних

Двійкова система дозволяє кодувати і текстову інформацію. Вісім двійкових розрядів достатньо для кодування 256 різних символів.

Першим міжнародним кодом став стандартний 7-бітний код ASCII (American Standard Code for Information Interchange - американський стандартний код для обміну інформацією). Поява даного коду в 1963 р зіграло значну роль, оскільки до цього різні комп'ютери просто не могли взаємодіяти один з одним. Кожен виробник по-своєму уявляв символи алфавіту, цифри і керуючі коди.

В одних тільки апаратних засобах корпорації IBM використовувалося дев'ять різних наборів кодування символів. Але взаємодія між комп'ютерами стало нагальною потребою. У 1961 р комітет Американського національного інституту стандартів (ANSI), в якому була представлена велика частина виробників комп'ютерів, приступив до розробки міжнародного стандарту. Комітету знадобилося понад два роки, щоб проаналізувати позиції всіх сторін, знайти компроміс і завершити розробку універсального коду. Код ASCII став спільним знаменником для комп'ютерів, які раніше не мали один з одним нічого спільного. Всім буквах, цифрам, знакам і іншим символам (керуючим кодами) були поставлені у відповідність стандартні числові значення. Код ASCII підтримував 128 символів, що включають великі і малі символи латиниці, цифри, спеціальні знаки і керуючі коди. Базова таблиця кодування цього коду, починаючи з 32-го коду, наведена в табл. 1.2. Коди 0 ÷ 31 використані в даній таблиці як службові і керуючі.

Потім 7-бітний код ASCII був розширений до 256 символів і прийнятий як 8-бітний міжнародний стандарт ASCII-2, причому коди з 128 по 256 цього стандарту були задіяні для національних мов різних країн. Для СРСР в цій області була введена національна кодування ЯКІ-8 (код обміну інформацією, восьмизначний). Код ASCII залишився однією з небагатьох технологій, якій вдалося успішно пройти крізь десятиліття і дожити до наших днів. Сьогодні на основі коду ASCII випускається обладнання вартістю в мільярди доларів, більшість операційних систем до сих пір є сумісним з ASCII.

Існує кілька різних кодових таблиць для російського алфавіту. Так, кодування Windows-1251 була введена компанією Microsoft і, з огляду на широке поширення операційної системи Windows та інших програмних продуктів компанії в Росії, вона набула широкого поширення і використовується в персональних комп'ютерах (ПК), які працюють на цій платформі. текст,

Таблиця 1.2

Базова таблиця кодування ASCII

код

символ

код

символ

код

символ

код

символ

32

пробіл

56

8

80

Р

104

h

33

!

57

9

81

Q

105

i

34

"

58

:

82

R

106

j

35

#

59

;

83

S

107

k

36

$

60

<

84

т

108

1

37

%

61

=

85

і

109

m

38

&

62

>

86

V

110

n

39

'

63

?

87

W

111

про

40

(

64

@

88

X

112

P

41

)

65

А

89

Y

113

q

42

*

66

В

90

Z

114

r

43

+

67

З

91

[

115

s

44

,

68

D

92

116

t

45

-

69

Е

93

]

117

u

46

70

F

94

^

118

V

47

/

71

G

95

_

119

w

48

0

72

Н

96

'

120

x

49

1

73

I

97

A

121

y

50

2

74

J

98

B

122

z

51

3

75

До

99

c

123

{

52

4

76

L

100

d

124

|

53

5

77

М

101

е

125

}

54

6

78

N

102

f

126

~

55

7

79

Про

103

g

127

створений в одному кодуванні, зовсім по-іншому виглядає і не читається в інший. Наприклад, коду 222 відповідають різні символи в різних кодуваннях:

  • • ЯКІ-8 (операційна система UNIX) - ч;
  • • Windows-1251 (операційна система Windows) - Ю;
  • • ISO (стандарт для російської мови міжнародної організації зі стандартизації ISO) - О.

Останнім стандартом в області кодування текстової інформації вважається 16-розрядний універсальний міжнародний код Unicode (UNIversal CODE), що дозволяє кодувати 65 536 різних символів. Unicode охоплює 28 тис. Букв, знаків, складів і ієрогліфів національних мов світу, і 30 тис. Місць у ньому зарезервовано.

 
<<   ЗМІСТ   >>