Студопедия

Главная страница Случайная страница

КАТЕГОРИИ:

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Тема 15. Алгоритми обробки символьної інформації






Символьна інформація — це інформація, що відображається за допомогою символів (букв, цифр, знаків операцій і ін.).

IBM-сумісні комп'ютери обробляють 256 різних символів, кожен з яких кодується одним байтом. Відповідність символів і байтів задається таблицею кодування, в якому для кожного символу вказується відповідний байт.

Символи з кодами від 0 до 127 побудовані за стандартом ASCII (American Standard Code for Information Interchange — Американський стандартний код обміну інформацією, читається " аски"). Друга половина таблиці (коди 128... 255) в наший країні містить російські букви (кирилицю) і символи псевдографіки.

 

Коди 0...127 (кодування ASCII) Коди 128...255 (модифікований альтернативний варіант)

Для того, щоб визначити по цих таблицях код того, або іншого символу, потрібно скласти номер рядка з номером стовпця, в яких він розташований. Так, код цифри 5 рівний 05+048 = 053.

Символьна інформація в алгоритмах і програмах описується даними двох типів: символьним і літерним. Вони відрізняються один від одного тим, що значенням символьної змінної є один символ, а літерною — рядок символів.

Для даних символьного і літерного типів застосовані операції зчеплення (з'єднання, конкатенації) і порівняння (<, >, < =, > = =, < >)порівнювати можна рядки різної довжини. Порівняння здійснюється зліва направо відповідно до ASCII-кодів відповідних символів. Так, рядок " стіл" менше рядка " стілець", рядок " teacher" більше рядка " people", а рядок " пар" менше рядка " парад".

По зрозумілих причинах у перших мовах програмування строковому типу приділялося набагато менше уваги, ніж арифметичному типу, або масивам. Тому в різних мовах рядка представлений по-різному й стандарт на строковий тип склався відносно недавно. Коли говорять про строковий тип, то звичайно розрізняють тип, що представляє:

· окремі символи, найчастіше, його називають типом char;

· рядка постійної довжини, часто вони представляються масивом символів;

· рядка змінної довжини - це, як правило, тип string, що відповідає сучасному поданню про строковий тип.

Символьний тип char, що представляє окремий випадок рядків - довжиною 1, корисний у багатьох завданнях. Основні операції над рядками - це розбір і збірка. При їхньому виконанні доводиться, найчастіше, доходити до кожного символу рядка. Ефективно реалізуються звичайні операції над рядками - визначення входження одного рядка в іншу, виділення підрядка, заміна символів рядка. Однак помітьте, подання рядка масивом символів добре тільки для рядків постійної довжини. Масив не пристосований до зміни його розмірів, вставки або видаленню символів (підрядків).

Найбільше часто використовуваним стрічковим типом є тип, звичайно називаний string, що задає рядок змінної довжини. Над цим типом допускаються операції пошуку входження одного рядка в інший, операції вставки, заміни й видалення підрядків.


Поделиться с друзьями:

mylektsii.su - Мои Лекции - 2015-2024 год. (0.006 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал