Аналітико-синтетичні засоби обробки інформації

Автор работы: Пользователь скрыл имя, 13 Апреля 2015 в 16:11, курсовая работа

Описание работы

Актуальність теми курсової роботи полягає в тому, що з кожним роком зростає обсяг і потужність інформаційного потоку. Упорядкувати цей потік і тримати його в контрольованому руслі можна тільки за допомогою автоматизованих систем обробки та переробки інформації. В основі цих систем (методів) лежать процеси аналізу первинних документів (індексація і предметизація) і синтезу (генерація вторинних документів, складання каталогів). У закінченому вигляді (база даних первинних документів, бібліографічні описи та засоби пошуку) разом з пам'ятками минулого і становлять національну спадщину країни.

Файлы: 1 файл

Analitiko-sintetichna_obrobka_infr_Kursova_1.docx

— 88.87 Кб (Скачать файл)

Цей стандарт повинні застосовувати всі розташовані на території України суб'єкти господарської діяльності незалежно від їх організаційно-правової та відомчої належності. Важливість проблем зберігання і охорони книжкових раритетів, які складають національну спадщину, спонукало ЮНЕСКО в жовтні 2003 року прийняти т.зв. Хартію про збереження цифрової спадщини

У Хартії зокрема, йдеться: «Цифрова спадщина складається з унікальних ресурсів людських знань і форм вираження. Воно охоплює ресурси, пов'язані з області культури, освіти, науки та управління, а також інформацію технічного, правового, медичного та іншого характеру, яка створюються у цифровій формі або переводиться в цифровий формат шляхом перетворення існуючих ресурсів на аналогових носіях. У випадку "цифрового походження" ресурси існують лише у вигляді цифрового оригіналу.

Цифрові матеріали включають в себе текстові документи, бази даних, нерухомі і рухомі зображення, звукові і графічні матеріали, програмне забезпечення та веб-сторінки, представлені в значному і безперервно зростаючому кількості форматів. Найчастіше ці матеріали фіксуються на короткий термін і вимагають прийняття цілеспрямованих заходів, спрямованих на їх створення, збереження та управління ними.

Багато з цих ресурсів мають неминущу цінність і значимість і, таким чином, представляють собою спадщину, яку необхідно зберегти для нинішнього і майбутніх поколінь.

1.3. Наукова обробка документів як сукупність процесів аналізу і синтезу

Головне завдання такої обробки - забезпечення швидкого доступу читача (користувача) до документа,що його цікавить.[7, 50]

Цей процес здійснюється в кілька етапів:

    1. проводиться систематичний аналіз усіх наявних в базі даних документів.

Цей аналіз передбачає ретельне вивчення первинного документа з метою складання короткого представлення про нього (анотація, реферат), виділення набору ключових слів, що складають предмет документа, а також індексацію документа прийнятими на Україні системами (УДК та ББК);

2) наступний етап - синтетичний, коли за результатами першого етапу складається бібліографічний опис первинного документа (продукується вторинний документ - інформаційне відображення первинного);

3) на третьому етапі  з вторинних документів (бібліографічні  описи, картки) складають каталог (алфавітний, предметний, систематичний);

4) четвертий етап - залучення  інформаційно-пошукової системи  для зв'язку читача (споживача).

Автоматизація процесу пошуку документів у величезних масивах сучасних інформаційних центрів і бібліотек не позбавляє споживачів інформації від неприємностей, пов'язаних з інформаційною кризою. Парадоксально, але вона ... тільки видозмінила його. Якщо до застосування автоматизованих ІПС споживач губився серед величезної маси непотрібної інформації, то ЕОМ звернула його увагу на потік, який максимально відповідає його потребам. Але, на жаль, інформації все ж занадто багато, щоб встигати переглядати її, залишаючи час хоча б для сну.

Інформаційна криза не була б принципово переборна взагалі, якщо б наукова інформація не володіла найважливішою властивістю - кумулятивністю. Так, зміст наукової статті може бути коротко викладено в рефераті, багато розлогі висновки зведені до лаконічних математичних формул. Досягнення науки були б набагато скромніше, якщо б кожен учений не міг скористатися тими знаннями, які накопичені суспільством до нього, якби він відкривав закони природи заново. І оскільки скористатися цими знаннями, а отже, і внести в прогрес що-небудь нове неможливо без звернення до наукових документів, то кожне покоління вчених зайнято не тільки отриманням нових наукових даних, але і спеціальною роботою з систематизації, оцінки та узагальнення наукової інформації, яка і заснована на її кумулятивності.

Така робота заснована, з одного боку, на аналізі наукової інформації, з іншого - на синтезі нової інформації. Тому ця робота називається аналітико-синтетичної обробкою інформації.

Витягти з документа його основний зміст, як це робиться при укладанні рефератів, узагальнити інформацію, що міститься в десятках публікацій в одному стислому огляді - ось завдання аналітико-синтетичної обробки наукових документів, вирішення яких дозволяє не тільки зменшити фізичний обсяг документів при збереженні їх основного змісту, але і синтезувати нову інформацію.

Поряд з автоматизацією процесів обробки документальної інформації велика увага приділяється і АСО: зростає кількість всіляких оглядів, каталогів, покажчиків, реферативних журналів, користування якими значно полегшує працю вчених і фахівців. Ці документи, створені в результаті аналітико-синтетичної обробки інших, називаються вторинними.

Деякі види вторинних видань можуть бути підготовлені автоматично (авторські, предметні покажчики і такі інші). Однак основною формою документа, що відображає результати аналізу і синтезу інформації, є огляд. Підготовка оглядів, у тому числі вищої їх форми - аналітичних оглядів, зрозуміло, під силу лише висококваліфікованим фахівцям. Існують і об'єднують їх зусилля організації, які виконують роботу з підготовки узагальненої науково-технічної інформації. Вони отримали назву центрів аналізу науково-технічної інформації.

На початку шістдесятих років у СРСР були створені інформаційні органи, які здійснювали аналітико-синтетичну переробку джерел інформації і готували на цій базі інформаційні видання, що містять фактографічні дані. В даний час понад 30% інформаційних органів підприємств групи машинобудівних галузей мають у своєму складі підрозділи аналізу та узагальнення інформації, укомплектовані фахівцями з тематики підприємства.

Підрозділи аналізу інформації успішно розвиваються, перш за все, у складі відділів НТІ великих головних інститутів, проте у ряді організацій такі підрозділи є самостійними відділами головних НТІ, які використовують фонди та довідковий апарат.

Найбільш великі центри аналізу та узагальнення інформації діють у складі галузевих і підгалузевих інформаційних органів.[21, 39]

Діяльність центру аналізу інформації дозволяє керівництву приймати обґрунтовані управлінські рішення на інформаційній та економічній основі, істотно підвищувати рівень розробки планів - від річного до перспективного. Зовсім виняткове значення має ця діяльність для прогнозування розвитку галузі.

За кордоном також приділяється велика увага діяльності центрів аналізу та узагальнення інформації. Цікаво відзначити, що, за даними США, ефект від діяльності центрів аналізу інформації становить 4,2 долара на 1 долар витрат.

Отже, у міру наростання потоків наукової та технічної інформації людство робить все більш енергійних заходів, щоб уберегти світ від інформаційного хаосу. У результаті на сьогоднішній день споживач інформації має в своєму розпорядженні цілий арсенал засобів, що дозволяє йому ефективно орієнтуватися в потоках інформації. Познайомитися з новинками він може, переглянувши реферативний журнал, причому якщо його цікавлять публікації певних авторів чи публікації по вузьких конкретних питаннях - до його послуг авторський, предметний і інші покажчики, звичайно прологом до журналу. Споживач може безпосередньо взаємодіяти з автоматизованою ІПС при пошуку як документальної, так і фактографічної інформації. Нарешті, досить цінну інформацію він почерпне з оглядових документів, підготовлених найбільш кваліфікованими фахівцями тієї галузі знань, в якій він працює. Якщо уявити собі споживача інформації зануреним у своєрідне «інформаційне середовище», з якої він черпає необхідну інформацію, то треба визнати, що в даний час вона стала для нього набагато більше «комфортною».

Проте, як відомо, «комфортність інформаційного середовища» вимагає від суспільства досить значних витрат. Чи можемо ми, наприклад, очікувати, що з будь-якого обраного нами тематичним напрямком ми обов'язково зустрінемо оглядовий документ? Звичайно, немає. Вторинні документи оглядового характеру повинні бути розраховані на широке коло споживачів і присвячені ключовим питанням науки і техніки.

Вибрати ці ключові питання, точно розрахувати сили і засоби для забезпечення максимального ефекту від аналітико-синтетичної обробки документів, як і від автоматизації обробки документальної інформації, можна тільки в тому випадку, якщо регулювати ці роботи в державному масштабі.

В Україні ці функції покладені на Державну систему науково-технічної інформації.

 

 

ВИСНОВОК ДО РОЗДІЛУ 1

Отже, враховуючи вище зазначене хочу сказати, що обробка інформації — вся сукупність операцій (збирання, введення, записування, перетворення, зчитування, зберігання, знищення, реєстрація), що здійснюються за допомогою технічних і програмних засобів, включаючи обмін по каналах передачі даних.

У процесі обробки інформації особливе значення має контроль виконання технічних і арифметичних операцій. Оброблена інформація повинна бути достовірною. Для контролю достовірності результатів обробки створюються спеціальні програми-тести. Операції тестування достовірності виконуються ЕОМ автоматично.

Зрозуміло, що оскільки в сучасних умовах життя інформація відіграє дуже важливу роль, то проблема її обробки є теж дуже важливою. Саме тому їй приділяється стільки уваги, розробляються нові більше ефективні та швидкісні методи обробки та звичайно ж нові інструментарії, що дозволяють швидко і зручно працювати із інформацією у всіх її проявах.

На сьогодні проблема зберігання книжкових пам’яток залишається актуальною і злободенною. Саме отримана з книжок інформація, закріплюючись у свідомості і підсвідомості людей формує ті чи інші уявлення про духовні цінності та моральні ідеали, норми поведінки і спілкування. Адже книга виступає символом традиційної культури, засобом збереження загальносвітової пам’яті людства, що робить її одним з найважливіших надбань матеріальної культури.

Цінність книжкових пам’яток визначається характеристиками двох складових книги – самого твору і способу його матеріального втілення (видання). У цьому полягає своєрідність книжкових пам'яток і складність виділення їх критеріїв.

На підставі проаналізованого матеріалу можна зробити висновок, що напрацьована правова база книжкових пам'яток потребує розвитку, адже частина питань стосовно їхнього збереження так і не підкріплена правовою базою і вирішується бібліотеками на свій розсуд. 
РОЗДІЛ 2. РОЛЬ НАУКОВОЇ ОБРОБКИ ДОКУМЕНТІВ У СФЕРІ ІНФОРМАЦІЙНОЇ ДІЯЛЬНОСТІ

2.1. Індексування як вид інформаційної діяльності

Проблема інформаційного пошуку - одна з найважливіших проблем інформатики. Інформаційний пошук, процес відшукання в деякій безлічі текстів (документів) всіх таких, які присвячені вказаній в запиті темі (предмету) або містять потрібні споживачеві факти, відомості.[13, 27]

Інформаційний пошук здійснюється за допомогою інформаційно-пошукової системи (ІПС) і виконується вручну або з використанням відповідних засобів механізації та автоматизації.

Інформаційно-пошукові системи можуть бути реалізовані за допомогою бібліографічної картотеки селектора, що містить перфокарти з крайової або внутрішньої перфорацією, ЕОМ і т.д. Для застосування ІПС необхідна систематизація та класифікація документів.

Однією з найпоширеніших класифікацій в даний час є універсальна десяткова класифікація (УДК), створена на основі десяткової класифікації М. Дьюї з ініціативи бельгійських вчених Поля Отле і Анрі Лафонтена. Всі знання, накопичені людством, розбиті в ній на 10 класів: 0. - загальний відділ; 1. - філософія, психологія; 2. - релігія; 3. - суспільні науки; 4. - вільний відділ; 5. - математика та природничі науки; 6. – прикладні науки, медицина, техніка; 7. – мистецтво, фотографія; 8. – мовознавство, філологія, художня літератур, літературознавство; 9. – краєзнавство, географія, біографія, історія.

Кожен з цих 10 класів ділиться на 10 підкласів, потім ще на десять і т.д. Класифікація є ієрархічною (відношення, при якому один клас є підкласом іншого, більш широкого). Для позначення класів, підкласів в УДК застосовані арабські цифри, абсолютно однозначні для всіх людей, незалежно від їхньої мови або алфавіту. Ця класифікація на сьогоднішній день є міжнародною.

П. Отле і А. Лафонтен бачили в УДК лише засіб для досягнення досконалої системи організації знань. Їх основною ідеєю була геніальна здогадка про необхідність впорядкування всесвітньої системи наукової комунікації. Ця ідея і сьогодні залишається актуальною, оскільки цілі, вперше сформульовані П. Отле на рубежі нашого століття, та ідеї, що розвивалися їм аж до середини 40-х років, далеко ще не реалізовані й нині, а потреба у створенні більш досконалої системи наукової комунікації в людському суспільстві відчувається зараз значно гостріше, ніж у минулі десятиліття. Його почин у створенні універсальної десяткової класифікації послужив надійною основою для подальшої колективної розробки цієї класифікації.

Поряд з УДК, в Україні широко використовуються бібліотечно-бібліографічна класифікація (ББК), міжнародна класифікація винаходів (МКІ), класифікатори промислової продукції і таке інше.[5, 10]

Широке поширення класифікацій пояснюється їх зручністю при інформаційному пошуку. Найпростіша Пошукова система являє собою каталог, організований за алфавітом, УДК чи за якоюсь іншою класифікації. У цьому випадку пошук здійснюється в масиві самих документів, представлених у вигляді каталожних карток. Після знаходження потрібної картки в каталозі подальший пошук зводиться до вилучення документа з полиці, де він зберігається. Здається, все просто і зручно. Дійсно, інформаційно-пошукові системи, організовані без застосування будь-яких засобів механізації пошуку, виправдовували себе протягом тривалого періоду.

Із зростанням потоків інформації різко збільшилися і обсяги каталогів. На пошук інформації стало йти значно більше часу, ніж колись. Поки величина масиву, в якому проводився пошук, не перевищувала кількох тисяч документів, миритися зі збільшенням часу пошуку було ще можна. Коли ж обсяг масивів став вимірюватися десятками тисяч документів, а в даний час у великих інформаційних органах такими цифрами вимірюється тільки щорічний приріст фондів, ручні методи пошуку, виявилися малопридатними.

Перші спроби зменшити час пошуку документів за допомогою механізації цього процесу відносяться до початку століття, коли з'явилися (1904 р.) карти з крайової перфорацією, що поклали початок застосуванню напівмеханізованими ІПС. У 1915 році американський вчений Г. Тейлор отримав патент на спосіб пошуку інформації за допомогою так званих суперпозиційних перфокарт. Однак практичне застосування ці перфокарти знайшли тільки в 1939 році. З тих пір перфокарти заслужили добру славу як вірні помічники людей в пошуку тієї чи іншої інформації.

Информация о работе Аналітико-синтетичні засоби обробки інформації