Системы кодирования

Помощь 01.08.2019

Помощь

При разработке кодов применяются разные системы и методы кодирования (их построение).

Под системой кодирования понимается совокупность правил, определяющих порядок обозначения объектов классификации знаками, с помощью которых обеспечивается представление, передача, обработка и хранение информации.

Порядковая - порядковая нумерация всех позиций номенклатуры, без пропуска свободных номеров.

Серийная - закрепление серий номеров по группам позиций, обладающих общим признаком, могут предусматриваться резервные номера.

Десятичная (позиционная) - каждый разряд кода (или несколько разрядов) закрепляются за определенным признаком. Вся номенклатура кодов классифицируется сначала по признаку, а уже внутри этого старшего признака выделяются младшие по значению признаки.

Смешанная - здесь используется несколько систем при кодировании. Применяется при кодировании сложных многозначных номенклатур (например: балансовый счет, субсчет).

Комбинированная - объединение в одном коде нескольких признаков.

Для построения классификатора применяются иерархический и фасетный методы. Иерархический метод классификации строится на основе последовательных многоуровневых отношений между объектами классификации. При этом каждый объект может попасть только в одну классификационную группу. Этот метод удобен для выделения функционально подчиненных объектов.

Фасетный метод классификации предусматривает деление объектов кодирования одновременно по нескольким классификационным признакам. Каждый объект при этом может быть отнесен к различным независимым классификационным группам. Внутри этих групп признаки могут иметь иерархическую структуру.

Стадии преобразования экономической информации

Сбор и регистрация информации.

На предприятии сбор и регистрация информации происходит при выполнении различных хозяйственных операций (прием готовой продукции, получение и отпуск материалов, …), в банках – при совершении финансово-кредитных операций с юридическими и физическими лицами. В процессе сбора фактической информации производится измерение, подсчет, взвешивание материальных объектов, подсчет денежных купюр, получение временных и количественных характеристик работы отдельных исполнителей. Сбор информации регистрируется на материальном носителе (документе, машинном носителе).Запись в первичные документы в основном осуществляется вручную, поэтому процедуры сбора и регистрации остаются наиболее трудоемкими и требуют автоматизации.

Технические средства :

персональные компьютеры для ввода информации документов и запись на машинный носитель;

сканеры для автоматического считывания информации документов в виде графических символов, распознавания графических образов и преобразования в текст;

считыватели пластиковых карточек;

Передача информации.

Передача информации осуществляется различными способами: с помощью курьера, пересылкой по почте, доставкой транспортными средствами, дистанционной передачей по каналам связи и т. Дистанционная передача данных сокращает время их движения, но удорожает процесс. Но этот вид постоянно развивается и совершенствуется и является наиболее перспективным.

Комплекс средств передачи информации :

локальные вычислительные сети;

региональные вычислительные сети расширенного масштаба;

глобальные вычислительные сети (Интернет);

Технические средства : модемы, факс-модемы, сетевой коммуникационное оборудование.

Хранение и накопление информации.

Хранении и накопление информации предназначено для многократного ее использования. Информация хранится и накапливается в информационных базах, на магнитных носителях в виде информационных массивов, где данные располагаются в определенном порядке.

Технические средства :

Базы данных хранятся на серверах БД, локальных компьютерах.

В качестве носителей информации используются: магнитные диски, оптические диски(лазерные), диски DVD (цифровые видеодиски), флеш-память.

Обработка информации.

Обработка информации производится на компьютере, как правило, децентрализовано, в местах возникновения первичной информации, где организуются автоматизированные рабочие места (АРМ) специалистов или иной управленческой службы. Обработка может проводиться не только автономно, но и в компьютерных вычислительных сетях.

Технические средства :

Обработка информации в ИС выполняется с помощью компьютеров, которые делятся на классы:

микрокомпьютеры – используются автономно в виде ПК, либо в сети в качестве рабочих станций, оснащенные современными микропроцессорами (Intel? AMD и др.), имеют различную архитектуру (ряд IBM PC? Macintosh и др.). В эту группу входят портативные компьютеры.

Мини-компьютеры – машины среднего уровня по производительности и серверным возможностям.

Формирование результатной информации.

В ходе решения задач на компьютере формируются результатные документы, сводки, которые печатаются или представляются в электронном виде и предоставляются пользователям.

Технические средства :

для отображения информации на экране используются видеомониторы;

для вывода информации используются принтеры, графопостроители.

Методы доступа к БД. Системы управления базами данных. Понятие данных и баз данных. Структура файла БД, ее описание.

Данные, по определению Уэбстера, есть «некоторый факт; то, на чем основан вывод или любая интеллектуальная система». Первичными компонентами данных (т.е. самые маленькие неделимые структурные единицы данных) являются цифры, буквы и символы естественного языка или их кодированное представление в виде строки двоичных билетов. Наименьшей семантически значимой поименной единицей данных является элемент данных. Совокупность взаимосвязанных элементов данных (полей), рассматриваемая в прикладной программе как целое, называется логической записью, а набор записей одного типа, но разных по содержанию - файлом. Запись данных определяется характером выполняемой задачи. Например, в качестве записи можно рассматривать данные документа, отражающем информацию о движении, объектов основных средств. Совокупность таких записей образует файл (или массив) данных. В теории и практике автоматизированных информационных систем понятие массива отождествляется с понятием файла. Массив (файл) представляет собой поименованную совокупность данных, объединенных по некоторому смысловому признаку или по нескольким признакам, однотипным по структуре и методу доступа. Хранение файлов может быть организовано в дисковой памяти ЭВМ.

Таким образом, понятие базы данных может быть сформулировано так: это совокупность массивов (файлов) данных предназначенных для обработки на ЭВМ, которая служит для удовлетворения нужд многих пользователей в рамках одного или нескольких предприятий и организаций. Информация хранится явным образом в базе данных и может включать различные типы логических записей. База данных ориентирована на интегрированные требования, а не на одну программу, способную обработать несколько частных файлов, каждый со своим собственным форматом.

Например: Программа Суперкалк обрабатывает данные (таблицы) с расширением.cal; программа EXEL – с.xls; ППП Clipper - .dbf.

Чтобы выполнить запрос на нужную информацию, в этом случае необходимо написать прикладную программу способную обработать несколько частных файлов, каждый со своим собственным форматом.

Для создания внутримашинного информационного обеспечения (БД) используются СУБД – системы управления и манипулирования данными в базе данных (БД).

База данных (БД) – это поименованная совокупность специальным образом организованных наборов данных, хранящихся на диске.

Управление БД включает в себя ввод данных, их корректировку и манипулирование данными, т.е. добавления, извлечения, обновления.

Развитые СУБД обеспечивают независимость прикладных программ, работающих с ними, от конкретной организации информации в базах данных. В зависимости от способа организации данных различают: сетевые, иерархические, распределенные, реляционные СУБД.

Из имеющихся СУБД наибольшее распространение получили СУБД DBase III, Dbase IV, СУБД «Rebus», FOXPRO, Microsoft ACCESS, Paradox, а также СУБД компании Oracle Informix, Sybase, Progress.

Интеграция различных компонентов в единую систему предоставляет пользователю неоспоримые преимущества в интерфейсе, но неизбежно проигрывает в части повышенных требований к оперативной памяти.

Из имеющихся пакетов можно выделить следующие:

Frame work, Microsoft Offic

Другой концепцией организации БД является концепция администратора базы данных (АБД). Под этим понятием подразумевается лицо (или группа лиц, или целое штатное подразделение), на которое возложено управление средствами базы данных предприятия. АБД должен быть энергичной и способной личностью, организатором по призванию, желательно с техническим образованием. Он должен уметь поддерживать взаимосвязи как с руководством высшего уровня, так и с пользователями базы данных, а также руководить штатом технических специалистов.

Этот штат должен включать лиц, имеющих опыт работы в таких областях, как программное обеспечение СУБД, операционные системы, техническое обеспечение ЭВМ, прикладное программирование, системное программирование. Важно, чтобы в этот штат были включены лица, имеющие полное представление о работе предприятия и его информационных потребностях.

Персонал АБД должен уметь поддерживать хорошие отношения с другими группами специалистов, не входящих в отдел обработки данных. Место АБД было определено тогда, когда руководители предприятий осознали необходимость централизованного управления ресурсами БД, обработкой данных и другими аспектами, связанными с БД. АБД является ответственным за анализ потребностей пользователей, проектирование БД, её внедрение, обновление, если необходимо, - реорганизацию БД, а также – за консультацию и обучение пользователей.

Структура файла БД, ее описание.

Каждый справочник в базе данных имеет свой идентификатор (имя файла БД). В качестве образца справочника предложен "Справочник постоянных удержаний из заработной платы", его идентификатор Zrp _ Uder . dbf , где ZRP_Uder - имя (условное обозначение) справочного массива, .dbf - расширение файла базы данных (расширение.dbf соответствует всем исходным файлам базы данных).

Файлы отчетов (результатные файлы) имеют расширение . frm В таблице 1 приведен а структура справочника системы ПРОНАР.

Структура справочника постоянных удержаний из заработной платы Zrp _ Uder . dbf

_______________________________________________________________________Таблица1____

№ Наименование Условное обоз Тип Длина Точ- Назначение

п.п показателя начение поля ность показателя __________________________________________________________________________

справочник постоянных удержаний из зарплаты работника может быть

следующей структуры:

1. Квартплата KV_PLATA число 6 2 сумма квартпл.

2. В сбербанк BANK_SUM число 6 2 сумма отчислен.

в сбербанк

3. Ссуда SSUDA _ MAX число 6 2 сумма выданной

работнику ссуды

4. Ссуда ежемесяч. SSU D A_SUM число 6 2 сумма ежемесяч.

отчислений по

ссуде из з.пл.

____________________________________________________________________________

Пример: "Справочник постоянных удержаний из ЗРП" используется при начислении удержаний из заработной платы работников предприятия.

Данные в справочник закладываются один раз на определенный длительный период. Например, выданная работнику ссуда вводится в поле SSUDA , а сумма ежемесячных отчислений по ссуде в поле SSUDA_SUM - эта сумма

в дальнейшем отражается в "Расчетно-платежной ведомости " и "Расчетном листке" в графе "Ссуда", используется для контроля отчислений в сбербанк, по ссуде и квартплате из начисленной суммы ЗРП работнику. По мере ежемесячных отчислений по ссуде при начислении удержаний из ЗРП работника, значение поля S SUDA контролируется программой, чтобы не была превышена выданная работнику сумма ссуды. Аналогично дать описание остальным значениям полей данного справочника.

Образец заполнения справочника удержаний:

На каждого работника предприятия в базе данных "Лицевые счета" бухгалтер по мере необходимости вводит данные о постоянных ежемесячных удержаниях из ЗРП в соответствующий справочник, который выглядит так:

Таблица 2

_____________Справочник постоянных удержаний _____________

Работник Иванов И.И. Таб.№ 153 Должность - бухгалтер

Ежемесячные Сумма max

отчисления

Квартплата 120.00

В сбербанк 300.00

Ссуда 250.00 5000.00

____________________________________________________________________

Способы размещения информации в ПД .

Существуют три основные формы размещения реквизитов и показателей в документе: линейная, анкетная и табличная.

При линейной форме размещения реквизиты располагаются построчно один за другим. Для каждого реквизита предусматривается место для записи его наименования (сверху) и значения (снизу).

При анкетной форме размещения реквизиты располагаются друг за другом в вертикальной последовательности сверху вниз. Каждая строка документа отводится для одного реквизита (показателя). Слева размещается наименование реквизита, справа – его значение.

При табличной форме реквизиты располагаются в виде таблицы в соответствующих строко-графах. По одному и тому же реквизиту может быть записано несколько значений.

При установлении расположения реквизитов и показателей в документе следует учитывать их назначение в процессе обработки данных документа. Любой документ условно делится на три зоны: Зона общих признаков, Содержательная зона, Зона подписей.

Зона общих признаков содержит постоянные, справочные и группировочные реквизиты и показатели, характерные для всего документа в целом (Наименование предприятия, Наименование и код структурного подразделения, Наименование документа, Дата выписки документа).

Зона подписей предусматривает строки для подписей руководящих и ответственных лиц, придающих документу юридическую силу.

Информатика, кибернетика и программирование

Система кодирования информации Кодирование информации применяют для унификации формы представления данных которые относятся кразличным типам в целях автоматизации работы с информацией. Например естественные человеческие языки можно рассматривать как системы кодирования понятий для выражения мыслей посредством речи к тому же и азбуки представляют собой системы кодирования компонентов языка с помощью графических символов. Основой этой системы кодирования является представление данных через последовательность двух знаков: 0 и 1. Наименьшая...

18. Система кодирования информации

Кодирование информации применяют для унификации формы представления данных, которые относятся кразличным типам, в целях автоматизации работы с информацией.

Кодирование это выражение данных одного типа через данные другого типа. Например, естественные человеческие языки можно рассматривать как системы кодирования понятий для выражения мыслей посредством речи, к тому же и азбуки представляют собой системы кодирования компонентов языка с помощью графических символов.

В вычислительной технике применяется двоичное кодирование. Основой этой системы кодирования является представление данных через последовательность двух знаков: 0 и 1. Данные знаки называются двоичными цифрами (binary digit), или сокращенно bit (бит). Одним битом могут быть закодированы два понятия: 0 или 1 (да или нет, истина или ложь и т. п.). Двумя битами возможно выразить четыре различных понятия, а тремя закодировать восемь различных значений.

Наименьшая единица кодирования информации в вычислительной технике после бита байт. Его связь с битом отражает следующее отношение: 1 байт = 8 бит = 1 символ.

Обычно одним байтом кодируется один символ текстовой информации. Исходя из этого для текстовых документов размер в байтах соответствует лексическому объему в символах.

Более крупной единицей кодирования информации служит килобайт, связанный с байтом следующим соотношением: 1 Кб = 1024 байт.

Другими, более крупными, единицами кодирования информации являются символы, полученные с помощью добавления префиксов мега (Мб), гига (Гб), тера (Тб):

1 Мб = 1 048 580 байт;

1 Гб = 10 737 740 000 байт;

1 Тб = 1024 Гб.

Для кодирования двоичным кодом целого числа следует взять целое число и делить его пополам до тех пор, пока частное не будет равно единице. Совокупность остатков от каждого деления, которая записывается справа налево вместе с последним частным, и будет являться двоичным аналогом десятичного числа.

В процессе кодирования целых чисел от 0 до 255 достаточно использовать 8 разрядов двоичного кода (8 бит). Применение 16 бит позволяет закодировать целые числа от 0 до 65 535, а с помощью 24 бит более 16,5 млн различных значений.

Для того чтобы закодировать действительные числа, применяют 80-разрядное кодирование. В этом случае число предварительно преобразовывают в нормализованную форму, например:

2,1427926 = 0,21427926 ? 101;

500 000 = 0,5 ? 106.

Первая часть закодированного числа носит название мантиссы, а вторая часть характеристики. Основная часть из 80 бит отводится для хранения мантиссы, и некоторое фиксированное число разрядов отводится для хранения характеристики.

Кодирование текстовой информации

Текстовую информацию кодируют двоичным кодом через обозначение каждого символа алфавита определенным целым числом. С помощью восьми двоичных разрядов возможно закодировать 256 различных символов. Данного количества символов достаточно для выражения всех символов английского и русского алфавитов.

В первые годы развития компьютерной техники трудности кодирования текстовой информации были вызваны отсутствием необходимых стандартов кодирования. В настоящее время, напротив, существующие трудности связаны с множеством одновременно действующих и зачастую противоречивых стандартов.

Для английского языка, который является неофициальным международным средством общения, эти трудности были решены. Институт стандартизации США выработал и ввел в обращение систему кодирования ASCII (American Standard Code for Information Interchange стандартный код информационного обмена США).

Для кодировки русского алфавита были разработаны несколько вариантов кодировок:

1) Windows-1251 введена компанией Microsoft; с учетом широкого распространения операционных систем (ОС) и других программных продуктов этой компании в Российской Федерации она нашла широкое распространение;

2) КОИ-8 (Код Обмена Информацией, восьмизначный) другая популярная кодировка российского алфавита, распространенная в компьютерных сетях на территории Российской Федерации и в российском секторе Интернет;

3) ISO (International Standard Organization Международный институт стандартизации) международный стандарт кодирования символов русского языка. На практике эта кодировка используется редко.

Ограниченный набор кодов (256) создает трудности для разработчиков единой системы кодирования текстовой информации. Вследствие этого было предложено кодировать символы не 8-разрядными двоичными числами, а числами с большим разрядом, что вызвало расширение диапазона возможных значений кодов. Система 16-разрядного кодирования символов называется универсальной UNICODE. Шестнадцать разрядов позволяет обеспечить уникальные коды для 65 536 символов, что вполне достаточно для размещения в одной таблице символов большинства языков.

Несмотря на простоту предложенного подхода, практический переход на данную систему кодировки очень долго не мог осуществиться из-за недостатков ресурсов средств вычислительной техники, так как в системе кодирования UNICODE все текстовые документы становятся автоматически вдвое больше. В конце 1990-х гг. технические средства достигли необходимого уровня, начался постепенный перевод документов и программных средств на систему кодирования UNICODE.

Кодирование графической информации

Существует несколько способов кодирования графической информации.

При рассмотрении черно-белого графического изображения с помощью увеличительного стекла заметно, что в его состав входит несколько мельчайших точек, образующих характерный узор (или растр). Линейные координаты и индивидуальные свойства каждой из точек изображения можно выразить с помощью целых чисел, поэтому способ растрового кодирования базируется на использовании двоичного кода представления графических данных. Общеизвестным стандартом считается приведение черно-белых иллюстраций в форме комбинации точек с 256 градациями серого цвета, т. е. для кодирования яркости любой точки необходимы 8-разрядные двоичные числа.

В основу кодирования цветных графических изображений положен принцип разложения произвольного цвета на основные составляющие, в качестве которых применяются три основных цвета: красный (Red), зеленый (Green) и синий (Blue). На практике принимается, что любой цвет, который воспринимает человеческий глаз, можно получить с помощью механической комбинации этих трех цветов. Такая система кодирования называется RGB (по первым буквам основных цветов). При применении 24 двоичных разрядов для кодирования цветной графики такой режим носит название полноцветного (True Color).

Каждый из основных цветов сопоставляется с цветом, дополняющим основной цвет до белого. Для любого из основных цветов дополнительным будет являться цвет, который образован суммой пары остальных основных цветов. Соответственно среди дополнительных цветов можно выделить голубой (Cyan), пурпурный (Magenta) и желтый (Yellow). Принцип разложения произвольного цвета на составляющие компоненты используется не только для основных цветов, но и для дополнительных, т. е. любой цвет можно представить в виде суммы голубой, пурпурной и желтой составляющей. Этот метод кодирования цвета применяется в полиграфии, но там используется еще и четвертая краска черная (Black), поэтому эта система кодирования обозначается четырьмя буквами CMYK. Для представления цветной графики в этой системе применяется 32 двоичных разряда. Данный режим также носит название полноцветного.

Приуменьшении количества двоичных разрядов, применяемых для кодирования цвета каждой точки, сокращается объем данных, но заметно уменьшается диапазон кодируемых цветов. Кодирование цветной графики 16-разрядными двоичными числами носит название режима High Color. При кодировании графической цветной информации с применением 8 бит данных можно передать только 256 оттенков. Данный метод кодирования цвета называется индексным.

Кодирование звуковой информации

В настоящий момент не существует единой стандартной системы кодирования звуковой информации, так как приемы и методы работы со звуковой информацией начали развиваться по сравнению с методами работы с другими видами информации самыми последними. Поэтому множество различных компаний, которые работают в области кодирования информации, создали свои собственные корпоративные стандарты для звуковой информации. Но среди этих корпоративных стандартов выделяются два основных направления.

В основе метода FM (Frequency Modulation) положено утверждение о том, что теоретически любой сложный звук может быть представлен в виде разложения на последовательность простейших гармонических сигналов разных частот. Каждый из этих гармонических сигналов представляет собой правильную синусоиду и поэтому может быть описан числовыми параметрами или закодирован. Звуковые сигналы образуют непрерывный спектр, т. е. являются аналоговыми, поэтому их разложение в гармонические ряды и представление в виде дискретных цифровых сигналов выполняется с помощью специальных устройств аналого-цифровых преобразователей (АЦП). Обратное преобразование, которое необходимо для воспроизведения звука, закодированного числовым кодом, производится с помощью цифроаналоговых преобразователей (ЦАП). Из-за таких преобразований звуковых сигналов возникают потери информации, которые связаны с методом кодирования, поэтому качество звукозаписи с помощью метода FM обычно получается недостаточно удовлетворительным и соответствует качеству звучания простейших электромузыкальных инструментов с окраской, характерной для электронной музыки. При этом данный метод обеспечивает вполне компактный код, поэтому он широко использовался в те годы, когда ресурсы средств вычислительной техники были явно недостаточны.

Основная идея метода таблично-волнового синтеза (Wave-Table) состоит в том, что в заранее подготовленных таблицах находятся образцы звуков для множества различных музыкальных инструментов. Данные звуковые образцы носят название сэмплов. Числовые коды, которые заложены в сэмпле, выражают такие его характеристики, как тип инструмента, номер его модели, высоту тона, продолжительность и интенсивность звука, динамику его изменения, некоторые компоненты среды, в которой наблюдается звучание, и другие параметры, характеризующие особенности звучания. Поскольку для образцов применяются реальные звуки, то качество закодированной звуковой информации получается очень высоким и приближается к звучанию реальных музыкальных инструментов, что в большей степени соответствует нынешнему уровню развития современной компьютерной техники.

А также другие работы, которые могут Вас заинтересовать
58115.		Значение здоровья для человека	41 KB
	Цель: ознакомить с задачами и содержанием курса Основы здоровья; формировать представление о значении здоровья для обучения труда общения с родными; развивать память мотивацию основ сохранения и укрепления здоровья; воспитывать любовь к жизни к людям.
58116.		Військові звання і знаки розрізнення. Начальники та підлеглі, старші та молодші, їх права і обовязки	182.5 KB
	Мета: Вивчити поняття щодо суті і значення військової дисципліни; Назвати статути Збройних сил України основні їх вимоги. Статути Збройних Сил України це зведення законів військової служби на основі яких проходять повсякденне життя виховання навчання бойова діяльність військ...
58118.		Функции финансов, как экономической категории	15.22 KB
	Именно через эту функцию реализуется общественное назначение финансов – обеспечение каждого субъекта хозяйствования и государства необходимыми ресурсами, использ. в форме денежных фондов целевого назначения.
58119.		Финансы как экономическая категория в системе социально-экономических категорий	15.17 KB
	Каждая наука оперирует определенным кругом понятий, имеет особые, специфические категории, которые являются концентрированным выражением общих, наиболее существенных признаков, качеств, закономерностей и взаимосвязей объектов той сферы
58120.		Создание Интернет-страниц	32 KB
	Он требует терпения и знания основ «программирования» на языке html, который, по сути, языком программирования не является. Итак. Для работы нам будет достаточно программы Блокнот. И даже более того, достаточно будет использовать только меню FILE.
58121.		СУСПІЛЬНО-ІСТОРИЧНІ УМОВИ РОЗВИТКУ УКРАЇНСЬКОЇ ЛІТЕРАТУРИ ХХ ст., ОСНОВНІ СТИЛЬОВІ НАПРЯМИ	120.5 KB
	Цi хронологiчнi межi визначаються не тiльки перебiгом революцiї 1905–1917 рр., а й вiдходом iз життя I. Франка (1916 р.) та М. Коцюбинського й Лесi Українки (обоє померли в 1913 р.). Формування пiсля 1905 р. Києва як лiтературної столицi України, поширення загальноукраїнської лiтературної перiодики
58122.		ВВЕДЕНИЕ. МИР В XVI – XVIII ВВ	46 KB
	В более узком смысле история - это наука, изучающая всевозможные источники о прошлом для того, чтобы установить последовательность событий, исторический процесс, объективность описанных фактов и сделать выводы о причинах событий.
58123.		Задачи бухгалтерского учета в общественном питании	34 KB
	Контроль за финансовыми показателями (размер прибыли, источники поступления средств и порядок их расходования, оборотные средства, отчисления от прибыли и.т.д.) за правильностью расчетов с поставщиками и покупателями, за своевременным поступлением платежей в бюджет, за правильностью использования банковских кредитов...

Система классификации

Важным понятием при работе с информацией является классификация объектов.

Классификация - cистема распределения объектов (предметов, явлений, процессов, понятий) по классам в соответствии с определенным признаком

Под объектом понимается любой предмет, процесс, явление материального или нематериального свойства. Система классификации позволяет сгруппировать объекты и выделить определенные классы, которые будут характеризоваться рядом общих свойств. Классификация объектов - то процедура группировки на качественном уровне, направленная на выделение однородных свойств. Применительно к информации как к объекту классификации выделенные классы называют информационными объектами .

Пример 2.6. Всю информацию об университете можно классифицировать по многочисленным информационным объектам, которые будут характеризоваться общими свойствами:

информация о студентах - в виде информационного объекта ""Студент"";

информация о преподавателях - в виде информационного объекта "Преподаватель";

информация о факультетах - в виде информационного объекта "Факультет" и т.п.

Свойства информационного объекта определяются информационными параметрами, называемыми реквизитами. Реквизиты представляются либо числовыми данными, например вес, стоимость, год, либо признаками, например цвет, марка машины, фамилия.

Реквизит - логически неделимый информационный элемент, описывающий определенное свойство объекта, процесса, явления и т.п.

Пример 2.7. Информация о каждом студенте в отделе кадров университета систематизирована и представлена посредством одинаковых реквизитов:

фамилия, имя, отчество;

год рождения;

место рождения;

адрес проживания;

факультет, где проходит обучение студент, и т.д.

Все перечисленные реквизиты характеризуют свойства информационного объекта "Студент".

Кроме выявления общих свойств информационного объекта классификация нужна для разработки правил (алгоритмов) и процедур обработки информации, представленной совокупностью реквизитов.

Пример 2.8.

Алгоритм обработки информационных объектов библиотечного фонда позволяет получить информацию о всех книгах по определенной тематике, об авторах, абонентах и т.д.

Алгоритм обработки информационных объектов фирмы позволяет получить информацию об объемах продаж, о прибыли, заказчиках, видах производимой продукции и т.д.

Алгоритмы обработки в том и другом случае преследуют разные цели, обрабатывают разную информацию, реализуются разными способами.

При любой классификации желательно, чтобы соблюдались следующие требования:

полнота охвата объектов рассматриваемой области;

однозначность реквизитов;

возможность включения новых объектов.

В любой стране разработаны и применяются государственные, отраслевые, региональные классификаторы. Например, классифицированы: отрасли промышленности, оборудование, профессии, единицы измерения, статьи затрат и т.д.

Классификатор - систематизированный свод наименований и кодов классификационных группировок.

При классификации широко используются понятия классификационный признак и значение классификационного признака, которые позволяют установить сходство или различие объектов. Возможен подход к классификации с объединением этих двух понятий в одно, названное как признак классификации. Признак классификации имеет также синоним основание деления.

Пример 2.9. В качестве признака классификации выбирается возраст, который состоит из трех значений: до 20 лет, от 20 до 30 лет, свыше 30 лет.

Можно в качестве признаков классификации использовать: возраст до 20 лет, возраст от 20 до 30 лет, возраст свыше 30 лет,

Разработаны три метода классификации объектов: иерархический, фасетный, дескрипторный. Эти методы различаются разной стратегией применения классификационных признаков. Рассмотрим основные идеи этих методов для создания систем классификации.

Иерархическая система классификации

Иерархическая система классификации (рис. 2.3) строится следующим образом:

исходное множество элементов составляет 0-й уровень и делится в зависимости от выбранного классификационного признака на классы (группировки), которые образуют 1-й уровень;
каждый класс 1-го уровня в соответствии со своим, характерным для него классификационным признаком делится на подклассы, которые образуют 2-й уровень;
каждый класс 2-го уровня аналогично делится на группы, которые образуют 3-й уровень и т.д.

Рис. 2.3. Иерархическая система классификации

Учитывая достаточно жесткую процедуру построения структуры классификации, необходимо перед началом работы определить ее цель, т.е. какими свойствами должны обладать объединяемые в классы объекты. Эти свойства принимаются в дальнейшем за признаки классификации.

Запомните! В иерархической системе классификации из-за жесткой структуры особое внимание следует уделить выбору классификационных признаков.

В иерархической системе классификации каждый объект на любом уровне должен быть отнесен к одному классу, который характеризуется конкретным значением выбранного классификационного признака. Дня последующей группировки в каждом новом классе необходимо задать свои классификационные признаки и их значения. Таким образом, выбор классификационных признаков будет зависеть от семантического содержания того класса, для которого необходима группировка на последующем уровне иерархии.

Количество уровней классификации, соответствующее числу признаков, выбранных в качестве основания деления, характеризует глубину классификации .

Достоинства иерархической системы классификации:

простота построения;
использование независимых классификационных признаков в различных ветвях иерархической структуры. Недостатки иерархической системы классификации;
жесткая структура, которая приводит к сложности внесения изменений, так как приходится перераспределять все классификационные группировки;
невозможность группировать объекты по заранее не предусмотренным сочетаниям признаков.

Пример 2.10. Поставлена задача - создать иерархическую систему классификации для информационного объекта "Факультет", которая позволит классифицировать информацию обо всех студентах по следующим классификационным признакам: факультет, на котором он учится, возрастной состав студентов, пол студента, для женщин - наличие детей. Система классификации представлена на рис.2.4 и будет иметь следующие уровни:

0-й уровень. Информационный объект "Факультет";

1-й уровень. Выбирается классификационный признак - название факультета, что позволяет выделить несколько классов с разными названиями факультетов, в которых хранится информация обо всех студентах;

2-й уровень. Выбирается классификационный признак - возраст, который имеет три градации: до 20 лет, от 20 до 30 лет, свыше 30 лет. По каждому факультету выделяются три возрастных подкласса студентов;

3-й уровень. Выбирается классификационный признак - пол. Каждый подкласс 2-го уровня разбивается на две группы. Таким образом, информация о студентах каждого факультета в каждом возрастном подклассе разделяется на две группы - мужчин и женщин;

4-й уровень. Выбирается классификационный признак - наличие детей у женщин: есть, нет.

Созданная иерархическая система классификации имеет глубину классификации, равную четырем.

Рис. 2.4. Пример иерархической системы классификации для информационного объекта "Факультет"

Фасетная система классификации

Фасетная система классификации в отличие от иерархической позволяет выбирать признаки классификации независимо как друг от друга, так и от семантического содержания классифицируемого объекта. Признаки классификации называются фасетами (facet - рамка). Каждый фасет (Ф i) содержит совокупность однородных значений данного классификационного признака. Причем значения в фасете могут располагаться в произвольном порядке хотя предпочтительнее их упорядочение.

Пример 2.11. Фасет цвет содержит значения: красный, белый, зеленый, черный, желтый.

Фасет специальность содержит названия специальностей.

Фасет образование содержит значения: среднее, среднее специальное, высшее.

Схема построения фасетной системы классификации в виде таблицы отображена на рис. 2.5. Названия столбцов соответствуют выделенным классификационным признакам (фасетам), обозначенным Ф 1 , Ф 2 ,..., Ф i ,..., Ф n . Например, цвет, размер одежды, вес и т.д. Произведена нумерация строк таблицы. В каждой клетке таблицы хранится конкретное значение фасета . Например, фасет цвет, обозначенный Ф 2 , содержит значения: красный, белый, зеленый, черный, желтый.

Ф 1 , Ф 2 ,..., Ф i ,..., Ф n

Рис 2.5. Фасетная система классификации

Процедура классификации состоит в присвоении каждому объекту соответствующих значений из фасетов. При этом могут быть использованы не все фасеты. Для каждого объекта задается конкретная группировка фасетов структурной формулой, в которой отражается их порядок следования:

Ks=(Ф 1 , Ф 2 ,..., Ф i ,..., Ф n) ,

где Ф i - i-й фасет;

n - количество фасетов.

При построении фасетной системы классификации необходимо, чтобы значения, используемые в различных фасетах, не повторялись. Фасетную систему легко можно модифицировать, внося изменения в конкретные значения любого фасета.

Достоинства фасетной системы классификации:

возможность создания большой емкости классификации, т.е. использования большого числа признаков классификации и их значений для создания группировок;

возможность простой модификации всей системы классификации без изменения структуры существующих группировок.

Недостатком фасетной системы классификации является сложность ее построения, так как необходимо учитывать все многообразие классификационных признаков.

Пример 2.12. Обратитесь к содержанию примера 2.10, где показано построение иерархической системы классификации. Для сопоставления разработаем фасетную систему классификации.

Сгруппируем и представим в виде таблицы (рис. 2.6) все классификационные признаки по фасетам:

фасет название факультета с пятью названиями факультетов;

фасет возраст с тремя возрастными группами;

фасет пол с двумя градациями;

фасет дети с двумя градациями.

Структурную формулу любого класса можно представить в виде:

K s = (Факультет, Возраст, Пол, Дети)

Присваивая конкретные значения каждому фасету, получим следующие классы:

К 1 = (Радиотехнический факультет, возраст до 20 лет, мужчина, есть дети);

K 2 = (Коммерческий факультет, возраст от 20 до 30 лет, мужчина, детей нет);

К 3 = (Математический факультет, возраст до 20 лет, женщина, детей нет) и т.д.

Рис. 2.6. Пример фасетной системы классификации для информационного объекта "Факультет"

Дескрипторная система классификации

Для организации поиска информации, для ведения тезаурусов (словарей) эффективно используется дескрипторная (описательная) система классификации, язык которой приближается к естественному языку описания информационных объектов. Особенно широко она используется в библиотечной системе поиска.

Суть дескрипторного метода классификации заключается в следующем:

отбирается совокупность ключевых слов или словосочетаний, описывающих определенную предметную область или совокупность однородных объектов. Причем среди ключевых слов могут находиться синонимы;
выбранные ключевые слова и словосочетания подвергаются нормализации, т.е. из совокупности синонимов выбирается один или несколько наиболее употребимых;
создается словарь дескрипторов , т.е. словарь ключевых слов и словосочетаний, отобранных в результате процедуры нормализации.

Пример 2.13. В качестве объекта классификации рассматривается успеваемость студентов. Ключевыми словами могут быть выбраны: оценка, экзамен, зачет, преподаватель, студент, семестр, название предмета. Здесь нет синонимов, и поэтому указанные ключевые слова можно использовать как словарь дескрипторов. В качестве предметной области выбирается учебная деятельность в высшем учебном заведении. Ключевыми словами могут быть выбраны: студент, обучаемый, учащийся, преподаватель, учитель, педагог, лектор, ассистент, доцент, профессор, коллега, факультет, подразделение университета, аудитория, комната, лекция, практическое занятие, занятие и т.д. Среди указанных ключевых слов встречаются синонимы, например: студент, обучаемый, учащийся, преподаватель, учитель, педагог, факультет, подразделение университета и т.д. После нормализации словарь дескрипторов будет состоять из следующих слов: студент, преподаватель, лектор, ассистент, доцент, профессор, факультет, аудитория, лекция, практическое занятие и т.д.

Между дескрипторами устанавливаются связи, которые позволяют расширить область поиска информации. Связи могут быть трех видов:

синонимические указывающие некоторую совокупность ключевых слов как синонимы;

родо-видовые , отражающие включение некоторого класса объектов в более представительный класс;

ассоциативные , соединяющие дескрипторы, обладающие общими свойствами.

Пример 2.14. Синонимическая связь: студент-учащийся-обучаемый.Родо-видовая связь: университет-факультет-кафедра. Ассоциативная связь: студент-экзамен-профессор-аудитория.

СИСТЕМА КОДИРОВАНИЯ

Общие понятия

Система кодирования применяется для замены названия объекта на условное обозначение (код) в целях обеспечения удобной и более эффективной обработки информации.

Система кодирования - совокупность правил кодового обозначения объектов.

Код строится на базе алфавита, состоящего из букв, цифр и других символов. Код характеризуется:

длиной - число позиций в коде;

структурой - порядок расположения в коде символов, используемых для обозначения классификационного признака.

Процедура присвоения объекту кодового обозначения называется кодированием . Можно выделить две группы методов, используемых в системе кодирования (рис.2.7), которые образуют:

классификационную систему кодирования, ориентированную на проведение предварительной классификации объектов либо на основе иерархической системы, либо на основе фасетной системы;

регистрационную систему кодирования, не требующую предварительной классификации объектов. Рассмотрим представленную на рис. 2.7 систему кодирования.

Рис. 2.7. Система кодирования, использующая разные методы

Классификационное кодирование

Классификационное кодирование применяется после проведения классификации объектов. Различают последовательное и параллельное кодирование.

Последовательное кодирование используется для иерархической классификационной структуры. Суть метода заключается в следующем: сначала записывается код старшей группировки 1-го уровня, затем код группировки 2-го уровня, затем код группировки 3-го уровня и т.д. В результате получается кодовая комбинация, каждый разряд которой содержит информацию о специфике выделенной группы на каждом уровне иерархической структуры. Последовательная система кодирования обладает теми же достоинствами и недостатками, что и иерархическая система классификации.

Пример 2.15. Проведем кодирование информации, классифицированной с помощью иерархической схемы (см. рис. 2.4). Количество кодовых группировок будет определяться глубиной классификации и равно 4, Прежде чем начать кодирование, необходимо определиться с алфавитом, т.е. какие будут использоваться символы. Для большей наглядности выберем десятичную систему счисления -10 арабских цифр. Анализ схемы на рис. 2.4 показывает, что длина кода определяется 4 десятичными разрядами, а кодирование группировки на каждом уровне можно делать путем последовательной нумерации слева направо. В общем виде код можно записать как ХХХХ, где Х - значение десятичного разряда. Рассмотрим структуру кода, начиная со старшего разряда:

1-й (старший) разряд выделен для классификационного признака "название факультета" и имеет следующие значения: 1 - коммерческий; 2 - информационные системы; 3 - для следующего названия факультета и т.д.;
2-й разряд выделен для классификационного признака "возраст" и имеет следующие значения: 1 - до 20 лет; 2 - от 20 до 30 лет; 3 - свыше 30 лет;
3-й разряд выделен для классификационного признака "пол" и имеет следующие значения: 1 - мужчины; 2 - женщины;
4-й разряд выделен для классификационного признака "наличие детей у женщин" и имеет следующие значения; 1 - есть дети; 2 - нет детей, 0 - для мужчин, так как подобной информации не требуется.

Принятая система кодирования позволяет легко расшифровать любой код группировки, например:

1310 - студенты коммерческого факультета, свыше 30 лет мужчины;

2221 - студенты факультета информационных систем, от 20 до 30 лет, женщины имеющие детей.

Параллельное кодирование используется для фасетной системы классификации. Суть метода заключается в следующем: все фасеты кодируются независимо друг от друга; для значений каждого фасета выделяется определенное количество разрядов кода. Параллельная система кодирования обладает теми же достоинствами и недостатками, что и фасетная система классификации.

Пример 2.16. Проведем кодирование информации, классифицированной с помощью фасетной схемы (см. рис. 2.6). Количество кодовых группировок определяется количеством фасетов и равно 4. Выберем десятичную систему счисления в качестве алфавита кодировки, что позволит для значений фасетов выделить один разряд и иметь длину кода, равную 4. В отличие от последовательного кодирования для иерархической системы классификации в данном метоле не имеет значения порядок кодировки фасетов. В общем виде код можно записать как ХХХХ, где Х - значение десятичного разряда. Рассмотрим структуру кода, начиная со старшего разряда:

1-й (старший) разряд выделен для фасета "кол" и имеет следующие значения: 1 - мужчины; 2 - женщины;

2-й разряд выделен для фасета "наличие детей у женщин" и имеет следующие значения: 1 - есть дети; 2 - нет детей; 0 - для мужчин, так как подобной информации не требуется;

3-й разряд выделен для фасета "возраст" и имеет следующие значения: 1 - до 20 лет; 2 - от 20 до 30 лет; 3 - свыше 30 лет;

4-й разряд выделен для фасета "название факультета" и имеет следующие значения 1 - радиотехнический, 2 - машиностроительный, 3 - коммерческий; 4 - информационные системы; 5 - математический и т.д.

Принятая система кодирования позволяет легко расшифровать любой кол группировки, например:

2135 - женщины в возрасте свыше 30 лет, имеющие детей и являющиеся студентами математического факультета;

1021 - мужчины возраста от 20 до 30 лет, являющиеся студентами радиотехнического факультета.

Регистрационное кодирование

Регистрационное кодирование используется для однозначной идентификации объектов и не требует предварительной классификации объектов. Различают порядковую и серийно-порядковую систему.

Порядковая система кодирования предполагает последовательную нумерацию объектов числами натурального ряда. Этот порядок может быть случайным или определяться после предварительного упорядочения объектов, например по алфавиту. Этот метод применяется в том случае, когда количество объектов невелико, например кодирование названий факультетов университета, кодирование студентов в учебной группе.

Серийно-порядковая система кодирования предусматривает предварительное выделение групп объектов, которые составляют серию, а затем в каждой серии производится порядковая нумерация объектов. Каждая серия также будет иметь порядковую нумерацию. По своей сути серийно-порядковая система является смешанной: классифицирующей и идентифицирующей. Применяется тогда, когда количество групп невелико.

Пример 2.17. Все студенты одного факультета разбиваются на учебные группы (в данной терминологии - серии), для которых используется порядковая нумерация. Внутри каждой группы производится упорядочение фамилий студентов по алфавиту и каждому студенту присваивается номер.

КЛАССИФИКАЦИЯ ИНФОРМАЦИИ ПО РАЗНЫМ ПРИЗНАКАМ

Любая классификация всегда относительна. Один и тот же объект может быть классифицирован по разным признакам или критериям. Часто встречаются ситуации, когда в зависимости от условий внешней среды объект может быть отнесен к разным классификационным группировкам. Эти рассуждения особенно актуальны при классификации видов информации без учета ее предметной ориентации, так как она часто может быть использована в разных условиях, разными потребителями, для разных целей.

На рис. 2.8 приведена одна из схем классификации циркулирующей в организации (фирме) информации. В основу классификации положено пять наиболее общих признаков: место возникновения, стадия обработки, способ отображения, стабильность, функция управления.

Рис. 2.8. Классификация информации, циркулирующей в организации

Место возникновения. По этому признаку информацию можно разделить на входную, выходную, внутреннюю, внешнюю.

Входная информация - это информация, поступающая в фирму или ее подразделения.

Выходная информация - это информация, поступающая из фирмы в другую фирму, организацию (подразделение).

Одна и та же информация может являться входной для одной фирмы, а для другой, ее вырабатывающей, выходной. По отношению к объекту управления (фирма или ее подразделение: цех, отдел, лаборатория) информация может быть определена как внутренняя, так и внешняя.

Внутренняя информация возникает внутри объекта, внешняя информация - за пределами объекта.

Пример 2.18. Содержание указа правительства об изменении уровня взимаемых налогов для фирмы является, с одной стороны, внешней информацией, с другой стороны - входной. Сведения фирмы в налоговую инспекцию о размере отчислений в госбюджет являются, с одной стороны, выходной информацией, с другой стороны - внешней по отношению к налоговой инспекции.

Стадия обработки. По стадии обработки информация может быть первичной, вторичной, промежуточной, результатной.

Первичная информация - это информация, которая возникает непосредственно в процессе деятельности объекта и регистрируется на начальной стадии.

Вторичная информация - это информация, которая получается в результате обработки первичной информации и может быть промежуточной и результатной.

Промежуточная информация используется в качестве исходных данных для последующих расчетов.

Результатная информация получается в процессе обработки первичной и промежуточной информации и используется для выработки управленческих решений.

Пример 2.19. В художественном цехе, где производится роспись чашек, в конце каждой смены регистрируется общее количество произведенной продукции и количество расписанных чашек каждым работником. Это первичная информация. В конце каждого месяца мастер подводит итоги первичной информации. Это будет, с одной стороны вторичная промежуточная информация, а с другой стороны - результатная. Итоговые данные поступают в бухгалтерию, где производится расчет заработной платы каждого работника в зависимости от его выработки. Полученные расчетные данные - результатная информация.

Способ отображения. По способу отображения информация подразделяется на текстовую и графическую.

Текстовая информация - это совокупность алфавитных, цифровых и специальных символов, с помощью которых представляется информация на физическом носителе (бумага, изображение на экране дисплея).

Графическая информация - это различного рода графики, диаграммы, схемы, рисунки и т.д.

Стабильность. По стабильности информация может быть переменной (текущей) и постоянной (условно-постоянной).

Переменная информация отражает фактические количественные и качественные характеристики производственно-хозяйственной деятельности фирмы. Она может меняться для каждого случая как по назначению, так и по количеству. Например, количество произведенной продукции за смену, еженедельные затраты на доставку сырья, количество исправных станков и т.п.

Постоянная (условно-постоянная) информация - это неизменная и многократно используемая в течение длительного периода времени информация. Постоянная информация может быть справочной, нормативной, плановой:

постоянная справочная информация включает описание постоянных свойств объекта в виде устойчивых длительное время признаков. Например, табельный номер служащего, профессия работника, номер цеха и т.п.;

постоянная нормативная информация содержит местные, отраслевые и общегосударственные нормативы. Например, размер налога на прибыль, стандарт на качество продуктов определенного вида, размер минимальной оплаты труда, тарифная сетка оплаты государственным служащим;

постоянная плановая информация содержит многократно используемые в фирме плановые показатели. Например, план выпуска телевизоров, план подготовки специалистов определенной квалификации.

Функция управления. По функциям управления обычно классифицируют экономическую информацию. При этом выделяют следующие группы: плановую, нормативно-справочную, учетную и оперативную (текущую).

Плановая информация - информация о параметрах объекта управления на будущий период. На эту информацию идет ориентация всей деятельности фирмы.

Пример 2.20. Плановой информацией фирмы могут быть такие показатели, как план выпуска продукции, планируемая прибыль от реализации, ожидаемый спрос на продукцию и т.д.

Нормативно-справочная информация содержит различные нормативные и справочные данные. Ее обновление происходит достаточно редко.

Пример 2.21. Нормативно-справочной информацией на предприятии являются:

время, предназначенное для изготовления типовой детали (нормы трудоемкости);

среднедневная оплата рабочего по разряду;

оклад служащего;

адрес поставщика или покупателя и т.д.

Учетная информация - это информация, которая характеризует деятельность фирмы за определенный прошлый период времени. На основании этой информации могут быть проведены следующие действия: скорректирована плановая информация, сделан анализ хозяйственной деятельности фирмы, приняты решения по более эффективному управлению работами и пр. На практике в качестве учетной информации может выступать информация бухгалтерского учета, статистическая информация и информация оперативного учета.

Пример 2.22. Учетной информацией являются: количество проданной продукции за определенный период времени; среднесуточная загрузка или простой станков и т.п.

Оперативная (текущая) информация - это информация, используемая в оперативном управлении и характеризующая производственные процессы в текущий (данный) период времени. К оперативной информации предъявляются серьезные требования по скорости поступления и обработки, а также по степени ее достоверности. От того, насколько быстро и качественно проводится ее обработка, во многом зависит успех фирмы на рынке.

Пример 2.23. Оперативной информацией являются:

количество изготовленных деталей за час, смену, день;

количество проданной продукции задень или определенный час;

объем сырья от поставщика на начало рабочего дня и т.д.

Классификация и ее виды. Системы кодирования информации
Классификацию информации, циркулирующей в организации

КЛАССИФИКАЦИЯ

Классификация

Классификация - система распределения объектов (предметов, явлений, процессов, понятий) по классам в соответствии с определенным признаком
Система классификации позволяет сгруппировать объекты и выделить определенные классы, которые будут характеризоваться рядом общих свойств.
Классификация объектов - то процедура группировки на качественном уровне, направленная на выделение однородных свойств.
Применительно к информации как к объекту классификации выделенные классы называют информационными объектами.

Классификация

Реквизит - логически неделимый информационный элемент, описывающий определенное свойство объекта, процесса, явления и т.п.
При любой классификации необходимо соблюдать следующие требования:
полнота охвата объектов рассматриваемой области;
однозначность реквизитов;
возможность включения новых объектов.
Классификатор - систематизированный свод наименований и кодов классификационных группировок.
При классификации широко используются понятия классификационный признак (основание деления) и значение классификационного признака, которые позволяют установить сходство или различие объектов.

Количество уровней классификации, соответствующее числу признаков, выбранных в качестве основания деления, характеризует глубину классификации.

Иерархическая система классификации

Иерархическая система классификации строится следующим образом:
исходное множество элементов составляет 0-й уровень и делится в зависимости от выбранного классификационного признака на классы (группировки), которые образуют 1-й уровень;
каждый класс 1-го уровня в соответствии со своим, характерным для него классификационным признаком делится на подклассы, которые образуют 2-й уровень;
каждый класс 2-го уровня аналогично делится на группы, которые образуют 3-й уровень и т.д.
Учитывая достаточно жесткую процедуру построения структуры классификации, необходимо перед началом работы определить ее цель, т.е. какими свойствами должны обладать объединяемые в классы объекты. Эти свойства принимаются в дальнейшем за признаки классификации.

Иерархическая система классификации

Достоинства иерархической системы классификации:
простота построения;
использование независимых классификационных признаков в различных ветвях иерархической структуры. Недостатки иерархической системы классификации;
жесткая структура, которая приводит к сложности внесения изменений, так как приходится перераспределять все классификационные группировки;
невозможность группировать объекты по заранее не предусмотренным сочетаниям признаков.

Поставлена задача - создать иерархическую систему классификации для информационного объекта "Факультет", которая позволит классифицировать информацию обо всех студентах по следующим классификационным признакам: факультет, на котором он учится, возрастной состав студентов, пол студента, для женщин - наличие детей.

Пример иерархической системы классификации

Полученная система классификации будет иметь следующие уровни:
0-й уровень. Информационный объект "Факультет";
1-й уровень. Выбирается классификационный признак - название факультета, что позволяет выделить несколько классов с разными названиями факультетов, в которых хранится информация обо всех студентах;
2-й уровень. Выбирается классификационный признак - возраст, который имеет три градации: до 20 лет, от 20 до 30 лет, свыше 30 лет. По каждому факультету выделяются три возрастных подкласса студентов;
3-й уровень. Выбирается классификационный признак - пол. Каждый подкласс 2-го уровня разбивается на две группы. Таким образом, информация о студентах каждого факультета в каждом возрастном подклассе разделяется на две группы - мужчин и женщин;
4-й уровень. Выбирается классификационный признак - наличие детей у женщин: есть, нет.

Пример иерархической системы классификации

Созданная иерархическая система классификации имеет глубину классификации, равную четырем

Фасетная система классификации в отличие от иерархической позволяет выбирать признаки классификации независимо как друг от друга, так и от семантического содержания классифицируемого объекта

Фасетная система классификации

Признаки классификации называются фасетами (facet - рамка). Каждый фасет (Фi ) содержит совокупность однородных значений данного классификационного признака. Причем значения в фасете могут располагаться в произвольном порядке хотя предпочтительнее их упорядочение.

Фасетная система классификации

Процедура классификации состоит в присвоении каждому объекту соответствующих значений из фасетов. При этом могут быть использованы не все фасеты.
Для каждого объекта задается конкретная группировка фасетов структурной формулой, в которой отражается их порядок следования:
Ks=(Ф1, Ф2,..., Фi,..., Фn),
где Фi - i-й фасет;
n - количество фасетов.
При построении фасетной системы классификации необходимо, чтобы значения, используемые в различных фасетах, не повторялись.
Фасетную систему легко можно модифицировать, внося изменения в конкретные значения любого фасета.

Фасетная система классификации

Достоинства фасетной системы классификации:
возможность создания большой емкости классификации, т.е. использования большого числа признаков классификации и их значений для создания группировок;
возможность простой модификации всей системы классификации без изменения структуры существующих группировок.
Недостатком фасетной системы классификации является сложность ее построения, так как необходимо учитывать все многообразие классификационных признаков.

Используя туже информацию, что и для примера с иерархической классификацией разработаем фасетную систему классификации.
Сгруппируем и представим в виде таблицы все классификационные признаки по фасетам:

фасет название факультета с пятью названиями факультетов;
фасет возраст с тремя возрастными группами;
фасет пол с двумя градациями;
фасет дети с двумя градациями.

Пример фасетной системы классификации

Структурную формулу любого класса можно представить в виде:

Ks= (Факультет, Возраст, Пол, Дети)

Присваивая конкретные значения каждому фасету, получим следующие классы:

К1= (Радиотехнический факультет, возраст до 20 лет, мужчина, есть дети);
K2= (Коммерческий факультет, возраст от 20 до 30 лет, мужчина, детей нет);
К3= (Математический факультет, возраст до 20 лет, женщина, детей нет) и т.д.

Пример фасетной системы классификации для информационного объекта "Факультет"

Для организации поиска информации, для ведения тезаурусов (словарей) эффективно используется дескрипторная (описательная) система классификации, язык которой приближается к естественному языку описания информационных объектов.
Особенно широко она используется в библиотечной системе поиска.

Дескрипторная система классификации

Суть дескрипторного метода классификации заключается в следующем:

отбирается совокупность ключевых слов или словосочетаний, описывающих определенную предметную область или совокупность однородных объектов. Причем среди ключевых слов могут находиться синонимы;
выбранные ключевые слова и словосочетания подвергаются нормализации, т.е. из совокупности синонимов выбирается один или несколько наиболее употребимых;
создается словарь дескрипторов, т.е. словарь ключевых слов и словосочетаний, отобранных в результате процедуры нормализации.

В качестве объекта классификации рассматривается успеваемость студентов.

Ключевыми словами могут быть выбраны: оценка, экзамен, зачет, преподаватель, студент, семестр, название предмета.
Здесь нет синонимов, и поэтому указанные ключевые слова можно использовать как словарь дескрипторов.

Пример дескрипторной системы классификации

В качестве предметной области выбирается учебная деятельность в высшем учебном заведении.

Ключевыми словами могут быть выбраны: студент, обучаемый, учащийся, преподаватель, учитель, педагог, лектор, ассистент, доцент, профессор, коллега, факультет, подразделение университета, аудитория, комната, лекция, практическое занятие, занятие и т.д.
Среди указанных ключевых слов встречаются синонимы, например: студент, обучаемый, учащийся, преподаватель, учитель, педагог, факультет, подразделение университета и т.д. После нормализации словарь дескрипторов будет состоять из следующих слов: студент, преподаватель, лектор, ассистент, доцент, профессор, факультет, аудитория, лекция, практическое занятие и т.д.

Дескрипторная система классификации

Между дескрипторами устанавливаются связи, которые позволяют расширить область поиска информации. Связи могут быть трех видов:

синонимические указывающие некоторую совокупность ключевых слов как синонимы;
родо-видовые , отражающие включение некоторого класса объектов в более представительный класс;
ассоциативные , соединяющие дескрипторы, обладающие общими свойствами.

Пример
Синонимическая связь: студент-учащийся-обучаемый.
Родо-видовая связь: университет-факультет-кафедра.
Ассоциативная связь: студент-экзамен-профессор-аудитория.

КОДИРОВАНИЕ

Система кодирования

Система кодирования - совокупность правил кодового обозначения объектов.
Система кодирования применяется для замены названия объекта на условное обозначение (код) в целях обеспечения удобной и более эффективной обработки информации.
Код строится на базе алфавита, состоящего из букв, цифр и других символов.
Код характеризуется:

длиной - число позиций в коде;
структурой - порядок расположения в коде символов, используемых для обозначения классификационного признака

Система кодирования

Процедура присвоения объекту кодового обозначения называется кодированием .
Можно выделить две группы методов, используемых в системе кодирования, которые образуют:

классификационную систему кодирования, ориентированную на проведение предварительной классификации объектов либо на основе иерархической системы, либо на основе фасетной системы;
регистрационную систему кодирования, не требующую предварительной классификации объектов.

Система кодирования

Система кодирования, использующая разные методы

Классификационное кодирование. Последовательное кодировани.

Последовательное кодирование используется для иерархической классификационной структуры.
Суть метода заключается в следующем: сначала записывается код старшей группировки 1-го уровня, затем код группировки 2-го уровня, затем код группировки 3-го уровня и т.д. В результате получается кодовая комбинация, каждый разряд которой содержит информацию о специфике выделенной группы на каждом уровне иерархической структуры
Последовательная система кодирования обладает теми же достоинствами и недостатками, что и иерархическая система классификации.

Проведем кодирование информации, классифицированной с помощью иерархической схемы.
Количество кодовых группировок будет определяться глубиной классификации и равно 4,
Прежде чем начать кодирование, необходимо определиться с алфавитом, т.е. какие будут использоваться символы.
Для большей наглядности выберем десятичную систему счисления -10 арабских цифр.
Анализ схемы классификации показывает, что длина кода определяется 4 десятичными разрядами, а кодирование группировки на каждом уровне можно делать путем последовательной нумерации слева направо.

Классификационное кодирование. Пример последовательного кодирования

1-й (старший) разряд выделен для классификационного признака "название факультета" и имеет следующие значения: 1 - коммерческий; 2 - информационные системы; 3 - для следующего названия факультета и т.д.;
2-й разряд выделен для классификационного признака "возраст" и имеет следующие значения: 1 - до 20 лет; 2 - от 20 до 30 лет; 3 - свыше 30 лет;
3-й разряд выделен для классификационного признака "пол" и имеет следующие значения: 1 - мужчины; 2 - женщины;
4-й разряд выделен для классификационного признака "наличие детей у женщин" и имеет следующие значения; 1 - есть дети; 2 - нет детей, 0 - для мужчин, так как подобной информации не требуется.

Классификационное кодирование. Пример последовательного кодирования

Принятая система кодирования позволяет легко расшифровать любой код группировки, например:

1310 - студенты коммерческого факультета, свыше 30 лет мужчины;
2221 - студенты факультета информационных систем, от 20 до 30 лет, женщины имеющие детей.

Классификационное кодирование. Параллельное кодирование

Параллельное кодирование используется для фасетной системы классификации.
Суть метода заключается в следующем: все фасеты кодируются независимо друг от друга; для значений каждого фасета выделяется определенное количество разрядов кода.
Параллельная система кодирования обладает теми же достоинствами и недостатками, что и фасетная система классификации.

Проведем кодирование информации, классифицированной с помощью фасетной схемы.
Количество кодовых группировок определяется количеством фасетов и равно 4.
Выберем десятичную систему счисления в качестве алфавита кодировки, что позволит для значений фасетов выделить один разряд и иметь длину кода, равную 4.
В отличие от последовательного кодирования для иерархической системы классификации в данном метоле не имеет значения порядок кодировки фасетов.

Классификационное кодирование. Пример параллельного кодирования

В общем виде код можно записать как ХХХХ, где Х - значение десятичного разряда.
Рассмотрим структуру кода, начиная со старшего разряда:

1-й (старший) разряд выделен для фасета "кол" и имеет следующие значения: 1 - мужчины; 2 - женщины;
2-й разряд выделен для фасета "наличие детей у женщин" и имеет следующие значения: 1 - есть дети; 2 - нет детей; 0 - для мужчин, так как подобной информации не требуется;
3-й разряд выделен для фасета "возраст" и имеет следующие значения: 1 - до 20 лет; 2 - от 20 до 30 лет; 3 - свыше 30 лет;
4-й разряд выделен для фасета "название факультета" и имеет следующие значения 1 - радиотехнический, 2 - машиностроительный, 3 - коммерческий; 4 - информационные системы; 5 - математический и т.д.

Классификационное кодирование. Пример параллельного кодирования

Принятая система кодирования позволяет легко расшифровать любой кол группировки, например:

2135 - женщины в возрасте свыше 30 лет, имеющие детей и являющиеся студентами математического факультета;
1021 - мужчины возраста от 20 до 30 лет, являющиеся студентами радиотехнического факультета.

Регистрационное кодирование

Порядковая система кодирования предполагает последовательную нумерацию объектов числами натурального ряда. Этот порядок может быть случайным или определяться после предварительного упорядочения объектов, например по алфавиту. Этот метод применяется в том случае, когда количество объектов невелико, например кодирование названий факультетов университета, кодирование студентов в учебной группе.

Серийно-порядковая система кодирования предусматривает предварительное выделение групп объектов, которые составляют серию, а затем в каждой серии производится порядковая нумерация объектов. Каждая серия также будет иметь порядковую нумерацию. По своей сути серийно-порядковая система является смешанной: классифицирующей и идентифицирующей. Применяется тогда, когда количество групп невелико.

Классификация информации по разным признакам

Любая классификация всегда относительна. Один и тот же объект может быть классифицирован по разным признакам или критериям.
Часто встречаются ситуации, когда в зависимости от условий внешней среды объект может быть отнесен к разным классификационным группировкам.
Эти рассуждения особенно актуальны при классификации видов информации без учета ее предметной ориентации, так как она часто может быть использована в разных условиях, разными потребителями, для разных целей.

Классификация информации по разным признакам

Классификация информации, циркулирующей в организации

Классификация информации по месту возникновения

Входная информация - это информация, поступающая в фирму или ее подразделения.
Выходная информация - это информация, поступающая из фирмы в другую фирму, организацию (подразделение).
Одна и та же информация может являться входной для одной фирмы, а для другой, ее вырабатывающей, выходной. По отношению к объекту управления (фирма или ее подразделение: цех, отдел, лаборатория) информация может быть определена как внутренняя, так и внешняя.
Внутренняя информация возникает внутри объекта, внешняя информация - за пределами объекта.

Классификация информации по стадии обработки

Первичная информация - это информация, которая возникает непосредственно в процессе деятельности объекта и регистрируется на начальной стадии.
Вторичная информация - это информация, которая получается в результате обработки первичной информации и может быть промежуточной и результатной.
Промежуточная информация используется в качестве исходных данных для последующих расчетов.
Результатная информация получается в процессе обработки первичной и промежуточной информации и используется для выработки управленческих решений.

Классификация информации по способу отображения

Текстовая информация - это совокупность алфавитных, цифровых и специальных символов, с помощью которых представляется информация на физическом носителе (бумага, изображение на экране дисплея).
Графическая информация - это различного рода графики, диаграммы, схемы, рисунки и т.д.

Переменная информация отражает фактические количественные и качественные характеристики производственно-хозяйственной деятельности фирмы. Она может меняться для каждого случая как по назначению, так и по количеству. Например, количество произведенной продукции за смену, еженедельные затраты на доставку сырья, количество исправных станков и т.п.
Постоянная (условно-постоянная) информация - это неизменная и многократно используемая в течение длительного периода времени информация.

Классификация информации по стабильности

Постоянная информация может:
постоянная справочная информация включает описание постоянных свойств объекта в виде устойчивых длительное время признаков. Например, табельный номер служащего, профессия работника, номер цеха и т.п.;
постоянная нормативная информация содержит местные, отраслевые и общегосударственные нормативы. Например, размер налога на прибыль, стандарт на качество продуктов определенного вида, размер минимальной оплаты труда, тарифная сетка оплаты государственным служащим;
постоянная плановая информация содержит многократно используемые в фирме плановые показатели. Например, план выпуска телевизоров, план подготовки специалистов определенной квалификации.

Классификация информации по функции управления

По функциям управления обычно классифицируют экономическую информацию.
Плановая информация - информация о параметрах объекта управления на будущий период.
Нормативно-справочная информация содержит различные нормативные и справочные данные. Ее обновление происходит достаточно редко
Учетная информация - это информация, которая характеризует деятельность фирмы за определенный прошлый период времени. На основании этой информации могут быть проведены следующие действия: скорректирована плановая информация, сделан анализ хозяйственной деятельности фирмы, приняты решения по более эффективному управлению работами и пр.

Оперативная (текущая) информация - это информация, используемая в оперативном управлении и характеризующая производственные процессы в текущий (данный) период времени. К оперативной информации предъявляются серьезные требования по скорости поступления и обработки, а также по степени ее достоверности.

Для полной формализации экономической информации недостаточно простой классификации, поэтому проводят следующую процедуру - кодирование. Кодирование - это процесс присвоения условных обозначений объектам и классификационным группам по соответствующей системе кодирования. Система кодирования - это совокупность правил обозначения объектов и группировок с использованием кодов. Код - это условное обозначение объектов или группировок в виде знака или группы знаков в соответствии с принятой системой. Код базируется на определенном алфавите (некоторое множество знаков). Число знаков этого множества называется основанием кода. Различают следующие типы алфавитов: цифровой, буквенный и смешанный.

Код храктеризуется следующими параметрами:

Длиной (L);

Основанием кодирования (A);

Структурой кода, под которой понимают распределение знаков по
признакам и объектам классификации;

Степенью информативности (I) , рассчитываемой как частное от
деления общего количества признаков(R) к длине кода (L):

I = R/L;

Коэффициентом избыточности (К из б), который определяется как
отношение максимального количества объектов (Qмах) к фактическому
количеству объектов(Qфакт):

Все системы кодирования можно сгруппировать в два подмножества (рис. 4.4): регистрационных и классификационных систем кодирования.

Особенностью регистрационных систем кодирования является их независимость от применяемых систем классификации. Регистрационные коды используются для идентификации объектов и передачи информации об объектах на расстояние, поэтому они должны удовлетворять следующим требованиям: минимальности длины кода, однозначности соответствия наименования объекта и его кода в течение длительного периода времени и защищённости кода от помех и ошибок.

Рис 4.4. Схема классификации систем кодирования Регистрационные коды состоят из двух частей: информационной и контрольной, предназначенной для защиты передаваемой информации от ошибок. Контрольная часть может рассчитываться по различным алгоритмам, в частности наиболее употребляемыми являются следующие формулы их расчета:

K = M-\ZX { *BJM\,

где M- модуль (простое число, делящееся на единицу и на само себя);

Xi - информационные разряды, i - номер разряда;

Bi - вес информационного разряда.

К регистрационным системам относятся порядковая и серийная системы кодирования.

Порядковая система - это наиболее простая по своему построению система кодирования, суть использования которой заключается в последовательном присвоении каждому объекту кодируемого множества М о номера его порядка, т.е. в присвоении цифр натурального ряда в порядке расположения объектов. Этот порядок может быть случайным или определяться после предварительной группировки объектов, например, по алфавиту.

Как правило, порядковую систему применяют для кодирования малозначных, устоявшихся и простых множеств объектов, не требующих предварительной классификации.

Серийная (серийно-порядковая) система кодирования отличается от порядковой тем, что номенклатура кодируемых объектов М о предварительно должна быть разбита на группировки по одному признаку и каждой группировке должна быть отводена серия кодовых обозначений, в пределах которой каждому элементу присваивается свой код по порядку. Серия обозначений для каждой группировки определяются таким образом, чтобы после присваивания кодов элементам этой группы в ней оставались бы еще свободные номера на случай появления новых объектов.

Классификационные коды используют для отражения классификационных взаимосвязей объектов и группировок и применяются в основном для сложной логической обработки экономической информации на ЭВМ, отсюда вытекают требования: однозначности отображения классификационных взаимосвязей объектов и их группировок и обеспечение максимальной простоты программирования. Группу классификационных систем кодирования можно разделить на две подгруппы в зависимости от того, какую систему классификации используют для упорядочения объектов.

Последовательные системы кодирования характеризуются тем, что они базируются на предварительной классификации по иерархической системе классификации, в результате использования которой коды нижестоящих группировок образуются путём добавления кодов к кодам вышестоящих группировок.

Параллельные системы кодирования характеризуются тем, что они строятся на основе использования фасетной системы классификации, и коды группировок по фасетам формируются независимо друг от друга.

Последовательные и параллельные системы кодирования строятся на базе разрядной или комбинированной систем кодирования.

Разрядная система применяется для кодирования объектов, определяемых несколькими соподчиненными признаками, используемыми для решения экономических задач. Кодируемые объекты систематизируются по классификационным признакам на каждой ступени классификации, каждому признаку отводится определенное число разрядов, в пределах которых кодирование группировок начинается с единицы. При разрядной системе кодирования имеет место так называемое "зависимое" кодирование. Это значит, что классификационные группировки по младшим признакам кодируются в зависимости от кода группировки, образованной по

старшему признаку. Запас свободных позиций определяется структурой кода.

Код объекта, построенный по этой системе, состоит из такого числа позиций (или числа групп разрядов), сколько было учтено признаков для объектов, поэтому разрядная система кодирования называется иногда позиционной системой. Конкретное значение признака, характеризующего объект, определяется позицией и значением определенного числа в структуре кода. Длина кода зависит от числа ступеней классификации, от числа классификационных группировок на каждой ступени и от основания кодирования.

Комбинированная система кодирования, обладая всеми преимуществами разрядного кода, применяется для кодирования больших номенклатур (перечней) объектов, которые характеризуются многими соподчиненными или независимыми признаками. Эта система базируется на сочетании принципов построения таких систем кодирования, как разрядная, серийная, порядковая и кода повторения.

Код повторения (мнемокод) - это буквенные или буквенно-цифровые коды, которые характеризуются тем, что в структуру кода переносят часть символьных обозначений объектов с целью повышения мнемоничности кода или для сокращения его длины.

Выбор конкретной системы кодирования зависит от объема кодируемой номенклатуры, ее стабильности, от задач, стоящих перед системой, и от показателей эффективности обработки информации при использовании какой-либо системы.

3. Состав и содержание операций проектирования

Классификаторов

Все классификаторы, разрабатываемые и используемые в ЭИС, имеют эталонную и рабочую формы. Эталонная форма классификатора - это официальное издание классификатора на бумажном носителе, удобное для осуществления его ведения. Рабочая форма классификатора - это весь классификатор или его раздел, занесённый на машинный носитель и удобный для обработки информации.

Весь процесс разработки системы классификаторов для ЭИС можно

разбить на четыре этапа (на рис. 4.5 приведена блок-схема процесса

разработки классификатора).

На первом этапе "Разработка ТЗ на проектирование" выполняются две работы. Первая из них связана с определением состава, назначения и сферы действия классификаторов, используемых в системе. Перечень классификаторов определяется на основе анализа

реквизитного состава первичных и результатных документов и выделения всей совокупности реквизитов-признаков.

Далее определяют назначение классификаторов. Каждый классификатор может быть предназначен для однозначной идентификации объекта, передачи информации на расстояние по каналам связи или для поиска и логической обработки первичной информации с целью получения и выдачи результатной информации.

По сфере действия выделяют следующие виды классификаторов: международные, общегосударственные (общесистемные), отраслевые и локальные классификаторы.

Международные классификаторы входят в состав Системы международных экономических стандартов (СМЭС) и обязательны для передачи информации между организациями разных стран мирового сообщества. СМЭС представляет собой множество стандартных решений по классификационным группировкам и кодированию специальной и экономической информации и формированию источников этой информации. В состав СМЭС входят классификации Организации Объединенных наций (ООН) и ее специализированных образований, в том числе:

Международная стандартная отраслевая классификация всех видов
экономической деятельности (МСОК);

Классификация основных продуктов (КОП);

Международная стандартная торговая классификация (МСТК);

Классификация функций органов управления (КФОУ);

Классификация функций правительства;

Классификации продовольственных и сельскохозяйственных
организаций (RAO);

Классификации международной организации труда (МОТ);

Классификации ООН по вопросам образования, науки и культуры
(ЮНЕСКО);

Международная стандартная классификация образования (МСКО).

К числу классификаций, разработанных другими международными организациями, относятся:

Классификация международного энергетического агентства (МЭА);

Классификация Совета таможенного сотрудничества;

Система описания и кодирования товаров;

Классификация Всемирной туристической организации (ВТО);

Классификация деятельности, связанной с туризмом.

К классификациям Европейского сообщества и других международных региональных организаций относят:

Классификацию Европейского сообщества (ЕС);

Общую отраслевую классификацию экономической деятельности в
рамках ЕС (КДЕС) и другие.

Второй класс классификаторов образуют общегосударственные (общесистемные) классификаторы, обязательные для организации процессов передачи и обработки информации между экономическими системами государственного уровня внутри страны, состав которых будет рассмотрен в следующем разделе.

Для выполнения процедур обработки информации и передачи ее между организациями внутри отрасли используют отраслевые классификаторы. В пределах отдельных предприятий используют, как правило, локальные классификаторы.

Выполнение работ второго этапа связано с определением состава исходных данных и требований к разрабатываемым классификаторам.

К исходным данным, используемым в процессе проектирования, классификаторов относятся:

Состав задач, для которых разрабатывается классификатор;

Состав объектов классификации и мощность исходного множества;

Состав признаков классификации и число значений каждого
признака;

Наименования отдельных группировок и объектов; динамика процесса изменяемости состава задач, объектов и признаков.

1. Определение состава, назначения и сферы действия классификатора

2. Определение состава исходных данных и тр ебований к классификаторам

Разработка ТЗ на п роектирование

3. Разработка основных принципов построени я классификаторов

4. Разработка методики построения классифи катора

Разработка методи ческих материалов

5. Разработка инструктивных материалов по с бору и обработке данных

6. Сбор и обработка данных

Организация сбора и обработки исходн ых данных

7. Построение эталонной и рабочей формы кл ассификатора и системы ведения

8. Экспериментальная проверка и внесение ко рректив

Составление класс ификатора и систем ы его ведения

9. Утверждение и издание классификатора

Рис. 4.5. Схема процесса разработки классификатора

К требованиям, которым должны удовлетворять разрабатываемые классификаторы, можно отнести:

Полноту охвата объектов и признаков классификации каждым
классификатором,

Согласованность признаков деления множеств объектов с
алгоритмами обработки экономической информации,

Взаимную однозначность наименований объектов и их кодовых
обозначений,

Простоту кодирования и возможность автоматизации классификации
и кодирования,

Возможность увязки с другими классификаторами и системами
обозначений,

Эффективность использования классификатора при обработке
информации.

классификатора. К критериям построения классификатора относятся такие, как:

Критерий отнесения того или иного объекта к конкретному
классифицируемому множеству;

Степень охвата кодируемого множества объектов.

Принципы построения классификатора определяются структурой классификатора, т.е. количеством ветвей, выходящих из каждой классификационной группировки, количеством ступеней и числом уровней классификации. Классификатор считается однородным, если на каждой ступени из каждой классификационной группировки выходит одинаковое количество ветвей.

Кроме того, на этом этапе разрабатывается система взаимодействия классификаторов разных уровней, предназначенных обеспечивать взаимодействие ЭИС с внешней средой. Эта работа представляет собой разработку некоторого транслятора перехода от одного классификатора к другому. Но чтобы его создать, необходимо провести выбор некоторой системы взаимодействия различных классификаторов, ориентированных на некоторую номенклатуру объектов. Существуют следующие системы взаимодействия:

а) система равноправных классификаторов, которая
характеризуется тем, что на каждом уровне управления для целей
обработки информации используется свой локальный классификатор, а
для получения или передачи информации из внешней среды
используется соответствующий транслятор. Недостаток данной системы
заключается в том, что та система, которая имеет на входе наибольшее
количество потоков информации от различных организаций, должна
иметь наибольшее количество трансляторов;

б) система приоритетных классификаторов, применяется для
предприятий одной отрасли. При этой системе на каждом предприятии
этой отрасли и на каждом уровне управления имеются локальные
классификаторы. Обмен информацией осуществляется в терминах
классификатора вышестоящего уровня. Эта система даёт уменьшение
количества трансляторов независимо от числа входных и выходных
потоков. Однако трудности возникают при передаче потоков
информации между предприятиями, относящимися к разным отраслям;

в) система классификаторов-посредников применяется при
межотраслевом управлении. На каждом объекте любого уровня
управления обработка ведётся в терминах своего локального
классификатора, а обмен ведётся в терминах одного классификатора-
посредника. Преимущества такой системы заключаются в
необходимости создания только одного транслятора для каждого
предприятия и в обеспечении возможности централизованного ведения
классификатора-посредника, что дает минимальное количество ошибок
при кодировании информации и обеспечивает информационную
совместимость ЭИС разных уровней;

г) система единого классификатора для обработки информации на всех предприятиях, входящих в состав экономической макросистемы, и для передачи этой информации между ними возможна только гипотетически, но реально ее нельзя осуществить из-за необходимости осуществления кодирования всей информации, существующей в стране, используя очень громоздкие классификаторы.

К факторам, влияющим на выбор способа увязки классификатора, относят следующие:

Объем и характер обрабатываемой информации;

Объем и характер потоков получаемой и передаваемой информации;

Минимум трудовых и стоимостных затрат на разработку и
эксплуатацию системы ведения классификаторов.

На этом же этапе осуществляется разработка методик построения классификаторов, отражающих методы и последовательность выполнения отдельных операций по созданию классификаторов, содержание которых зависит от выбранных критериев и принципов их построения.

Третий этап связан с работами по организации сбора и обработки исходных данных, необходимых для составления классификаторов. К их числу относится разработка инструктивных материалов по сбору и обработке исходных данных:

Определение перечня решаемых задач, использующих
классификаторы;

Выделение классифицируемых объектов;

Определение состава признаков классификации и значений
признаков;

Осуществление лингвистической обработки этих данных (удаление
синонимов, омонимов, полисемии, антонимов и др.);

Согласование используемой терминологии в исходных данных с
гостами.

Другой работой, которую выполняют на этом этапе, является сбор и обработка данных согласно разработанным инструкциям.

На четвертом этапе "Составление классификаторов и системы их ведения" осуществляется построение эталонной и рабочей формы классификатора и системы ведения классификатора.

Эталонный классификатор должен быть согласован, отпечатан типографским способом и распространен всем пользователям для кодирования информации первичных документов.

Рабочие классификаторы наносятся на машинные носители в необходимых разрезах, передаются пользователям и заносятся в файлы справочников баз данных для выполнения процедуры автоматического заполнения машинных форм первичных документов и для декодирования результатной информации, получаемой после ее обработки.

К задачам, решаемым системой ведения классификатора относятся:

Актуализация классификатора, т.е. постоянное пополнение и
изменение объектов классификации и кодирования;

Своевременное оповещение всех пользователей о всех происходящих
изменениях;

Реструктуризация, или пересмотр структуры классификатора, при
котором осуществляется контроль на дублирование объектов
классификации, контроль и выявление тупиковых ветвей, не ведущих к
объекту, оптимизация резервных ветвей по всем уровням иерархии или
по всем аспектам классификации;

К проблемам, связанным с проектированием системы ведения классификаторов, относятся:

Разработка организационной структуры системы ведения, т.е.
службы, которая отвечает за пополнение классификаторов;

Разработка юридических основ внесения изменений в классификатор;

Разработка информационного и программного обеспечения системы.

Все работы по проектированию классификаторов заканчиваются экспериментальной проверкой и внесением корректив, утверждением, изданием и рассылкой классификаторов всем пользователям в функциональные подсистемы.

Системы кодирования

Стадии преобразования экономической информации

А также другие работы, которые могут Вас заинтересовать

Система классификации

Иерархическая система классификации

Фасетная система классификации

Дескрипторная система классификации

СИСТЕМА КОДИРОВАНИЯ

Классификационное кодирование

КЛАССИФИКАЦИЯ ИНФОРМАЦИИ ПО РАЗНЫМ ПРИЗНАКАМ

Классификация и ее виды. Системы кодирования информации

Классификацию информации, циркулирующей в организации

КЛАССИФИКАЦИЯ

Классификация

Классификация - система распределения объектов (предметов, явлений, процессов, понятий) по классам в соответствии с определенным признаком

Система классификации позволяет сгруппировать объекты и выделить определенные классы, которые будут характеризоваться рядом общих свойств.

Классификация объектов - то процедура группировки на качественном уровне, направленная на выделение однородных свойств.

Применительно к информации как к объекту классификации выделенные классы называют информационными объектами.

Классификация

Реквизит - логически неделимый информационный элемент, описывающий определенное свойство объекта, процесса, явления и т.п.

При любой классификации необходимо соблюдать следующие требования:

полнота охвата объектов рассматриваемой области;

однозначность реквизитов;

возможность включения новых объектов.

Классификатор - систематизированный свод наименований и кодов классификационных группировок.

Количество уровней классификации, соответствующее числу признаков, выбранных в качестве основания деления, характеризует глубину классификации.

Иерархическая система классификации

Иерархическая система классификации строится следующим образом:

каждый класс 1-го уровня в соответствии со своим, характерным для него классификационным признаком делится на подклассы, которые образуют 2-й уровень;

каждый класс 2-го уровня аналогично делится на группы, которые образуют 3-й уровень и т.д.

Иерархическая система классификации

Достоинства иерархической системы классификации:

простота построения;

использование независимых классификационных признаков в различных ветвях иерархической структуры. Недостатки иерархической системы классификации;

жесткая структура, которая приводит к сложности внесения изменений, так как приходится перераспределять все классификационные группировки;

невозможность группировать объекты по заранее не предусмотренным сочетаниям признаков.

Пример иерархической системы классификации

Полученная система классификации будет иметь следующие уровни:

0-й уровень. Информационный объект "Факультет";

4-й уровень. Выбирается классификационный признак - наличие детей у женщин: есть, нет.

Пример иерархической системы классификации

Созданная иерархическая система классификации имеет глубину классификации, равную четырем

Фасетная система классификации

Фасетная система классификации

Процедура классификации состоит в присвоении каждому объекту соответствующих значений из фасетов. При этом могут быть использованы не все фасеты.

Для каждого объекта задается конкретная группировка фасетов структурной формулой, в которой отражается их порядок следования:

Ks=(Ф1, Ф2,..., Фi,..., Фn),

где Фi - i-й фасет;

n - количество фасетов.

При построении фасетной системы классификации необходимо, чтобы значения, используемые в различных фасетах, не повторялись.

Фасетную систему легко можно модифицировать, внося изменения в конкретные значения любого фасета.

Фасетная система классификации

Достоинства фасетной системы классификации:

возможность создания большой емкости классификации, т.е. использования большого числа признаков классификации и их значений для создания группировок;

возможность простой модификации всей системы классификации без изменения структуры существующих группировок.

Недостатком фасетной системы классификации является сложность ее построения, так как необходимо учитывать все многообразие классификационных признаков.

Используя туже информацию, что и для примера с иерархической классификацией разработаем фасетную систему классификации.

Сгруппируем и представим в виде таблицы все классификационные признаки по фасетам:

Пример фасетной системы классификации

Структурную формулу любого класса можно представить в виде:

Присваивая конкретные значения каждому фасету, получим следующие классы:

Пример фасетной системы классификации для информационного объекта "Факультет"

Особенно широко она используется в библиотечной системе поиска.

Дескрипторная система классификации

Суть дескрипторного метода классификации заключается в следующем:

В качестве объекта классификации рассматривается успеваемость студентов.

Пример дескрипторной системы классификации

В качестве предметной области выбирается учебная деятельность в высшем учебном заведении.

Дескрипторная система классификации

Между дескрипторами устанавливаются связи, которые позволяют расширить область поиска информации. Связи могут быть трех видов:

Пример

Синонимическая связь: студент-учащийся-обучаемый.

Родо-видовая связь: университет-факультет-кафедра.

Ассоциативная связь: студент-экзамен-профессор-аудитория.

КОДИРОВАНИЕ

Система кодирования

Система кодирования - совокупность правил кодового обозначения объектов.

Система кодирования применяется для замены названия объекта на условное обозначение (код) в целях обеспечения удобной и более эффективной обработки информации.

Код строится на базе алфавита, состоящего из букв, цифр и других символов.

Код характеризуется: