Цифрлық бейненің негізгі мінездемелері

Автор работы: Пользователь скрыл имя, 07 Июня 2014 в 17:30, курсовая работа

Описание работы

Қазіргі кезде есептеу техникасының, сандық байланыс құралдарының, Интернеттің дамуымен, қуаты мол компьютерлерінің кең таралуымен байланысты сандық бейнелер кеңінен қолданысқа еніп, әлемдегі ақпарат қорының үлкен бөлігін құрауда. Бейнелер негізгі үш ерекшелігімен сипатталады: мәтіндерге қарағанда сақтау үшін жадының барынша көп бөлігін қажет етеді; адамдардың көру қабілетіне бағытталған мәліметтің ерекше типі; текстік ақпараттарға қарағанда екі өлшемді болып келеді. Бейне сандық түрде көп бит санымен берілетіндіктен оның сақталуына көп орын қажет және жолдау кезінде жылдамдығы аз болады. Бұдан бейнелерді сығуға деген қызығушылық тұрақты түрде қарқынды дамып отыр.

Файлы: 1 файл

теория диплом (Автосохраненный).docx

— 1.67 Мб (Скачать файл)

Қарапайым мысал: 4 x 4 келесі үш блоктарды салыстырайық.

(1–блок)

128 128 128 128

128 128 128 128

128 128 128 128

128 128 128 128 

(2–блок)

128 127 128 128

128 128 128 128

128 128 127 128

128 128 128 128 

(3–блок)

128 127 126 128

128 128 128 128

127 128 128 128

128 128 128 128 Бұл үш блоктар адам көзі үшін айрықсыз. Сонымен, екінші және үшінші блоктарды бірінші блокпен абыржымастан ауыстыруға болады. Сол кезде кодтық кітап келесі сипатқа келеді:

Кодтық кітап [1] =  128 128 128 128

    128 128 128 128

    128 128 128 128

    128 128 128 128

VQ технологиясының маңызды ерекшелігі болып бейнені қысқарту кезінде сол бір кодтық кітап кескіннің бірнеше кадрларын қолдана алу мүмкіндігі болып табылады.

Дискреттік Косинустық Түрлену (ДКТ)

Дискреттік Косинустық Түрлену (ДКТ) қолданатын компрессорлар: M-ti-n JPEG; Editable MPEG; MPEG-1; MPEG-2; MPEG-4; H.261; H.263; H.263+;

Артықшылықтары мен кемшіліктері:

- жоғары компрессия кезіндегі «блоктылық»;

- кескінің шиеленіскен бұрыштарының дөңгеленуі. Кескіннің шиеленіскен шеттерінің кездейсоқ «шайылып кетуі»;

- кодтау еңбекті қажет етеді. Сек соңғы кездерде ғана кодтау үрдісін аппаратты емес, бағдарламалық түрінде жүзеге асыруға қол жеткізілді.

ДКТ кескіндерді қысқартудағы кең қолданылатын түрлендіргіш болып табылады. Бейнеконференцияларында H.263 станлартын, сандық   MPEG (MPEG–1, MPEG–2 и MPEG–4) стандартын қолданатын, JPEG статикалық кескіндемесінің қысқарту стандарты-барлығы ДКТ қолданады. Бұл стандарттарда негізінде өлшемдері 8 x 8  пиксель болатын кескін блоктарына қолданылатын  2–өлшемді ДКТ қолданылады. ДКТ кейін кватизацияланатын 64 (8x8=64) коэффициентті нақты қысқартуды қамтамасыз ете отырып есептеп анықтайды. Көптеген кескіндерде ДКТ–коэффициенттерінің көбісі өзінің аздылығына қарай квантизациядан соң нөлге тең болады. ДКТ бұл қасиеті ДКТ қолданатын көптеген қысқарту алгоритмдерінің негізінде жатыр.

Оның үстіне, атап өтетін болсақ, адам көзі ДКТ үлкен коэффициенттерімен берілетін жоғары жиілікті кескінің құраушыларына аз сезімтал болып табылады. коэффициенттердің осы үлкен мәндеріне квантизацияның үлкен факторы қолданылу мүмкін (және, әдетте қолданылады). Негізінде JPEG алгоритмінде қолданылатын, 64 квантизация  факторларының матрицасы әрбір ДКТ 64 коэффициенттері үшін ДКТ коэффициенттерінің үлкен квантизациялану коэффициенттеріне, яғни, жоғары жиілікке ие. Квантизациядан соң коэффициенттер RLE алгоритміне душар болады. Ары қарай жиі комбинациялар үшін қысқа кодтық сөздер, ал сиректері үшін – қатысты ұзақ кодтық сөздер қолданылады. Мүмкін кодталу жүзеге асады.

ДКТ–ні өз кезегінде бірөлшемді ДКТ мысалында түсіндірген дұрыс. Екіөлшемді ДКТ пиксель блоктары жолдарының әрбір қатары (жолдары)  және бірөлшемді ДКТ жолдарынан алынатын пиксель блоктарының әрбір бағаналары үшін қоданылатын бірөлшемді ДКТ болып табылады. N  іріктемелеріне (кескіндегі пиксельдерге немесе дыбыстық файлдағы іріктемелерге) қолданылатын бірөлшемді ДКТ. ДКТ жолдары косинустық функциялардан тұратын NxN біртектілік матрицасы:

ДКП(m,n) = sqrt( (1 - delta(m,1) ) / N ) * c-s( (pi/N) * (n - 1/2) * (m-1) ), мұндағы

ДКП (m,n) – бірөлшемді ДКТ матрицасы;

 m, n = 1,...,N;

 pi = 3.14159267...;

 N = блоктағы іріктемелер саны.

 Егер m = 1 және теріс жағдайларында 0–ге тең болғанда delta(m,1) = 1  cоs(x) = косинус x, радианда өлшенеді.

Әрине, N іріктемелерден құралған блокта ДКТ қолдану N*N көбейту және жиынтықтау операцияларын қажет етеді. Алайда ДКТ матрицасының рекурсивті құрылымына байланысты математикалық операциялардың аз саны, атап айтқанда N l-g(N) керек болады. Бұл қасиеті ДКТ–ні жеке ЭЕМ–де қазіргі математикалық процессорларда қолданылуына ыңғайын туғызады.

Дискреттік Wavelet–түрлену (DWT)

Дискреттік Wavelet–түрлену (DWT, Discrete Wavelet Transfоrm) қолданатын компрессорлар: Intel Inde- 5.x; Intel Inde- 4.x ;VD-WAVE VD-NET'S; VxTreme.

Артықшылықтары мен кемшіліктері:

- DWT алгоритмі көмегімен қысқартылған статикалық болсын, динамикалық кескіндердің көбісі ДКТ алгоритміне сипаттас блоктық құрылымға ие емес;

- DWT қолданумен қатысты қысқартылған кескіндер сапасы қысқарту коэффициенттерінің сол шамаларында ДКТ алгоритмі арқылы қысқартылған кескіндер сапасынан асып түседі;

- DWT кескіннің шиеленіскен контурларын кішкене шайып, бұрыштарын дөңгелетеді. Әдетте контурлық шу немесе Гиббс эфектісі деп аталады.

DWT–алгоритм дабылды жіберу арқылы негізделген, мысалы бірнеше фильтрлі кескін: төмен жиілікті және жоғары жиілікті. Төмен жиілікті фильтр бастапқы материалдың дөрекі қалыптарын шығарып қояды. Жоғары жиілікті фильтр әртүрлілік немесе қосымша бөлшектену дабылын шығарады.

Өз кезегінде, жоғары жиілікті фильтр шығысындағы нәтиже (бөлшектенудің қосымша дабылы) сол үрдіске душар болуы мүмкін және т.с.с.

DWT қарапайым мысалы ретінде DWT Хара болып табылады:

Кірістік дабыл x[n] n индексті іріктемелер көпмүшесі болып табылады. Төмен жиілікті Хара фильтрі (1) (Haar Lоw Pass Filter) екі іріктемелердің арифметикалық ортасы:

 

g[n] = 1/2 * ( x[n] + x[n+1] )                                  (1)

 

Жоғары жиілікті Хара фильтрі (Haar High Pass Filter) екі сәтті іріктемелердің орташа арифметикалық өзгешелігі (2):

h[n] = 1/2 * ( x[n+1] - x[n] ) білініп тұр:

 

x[n] = g[n] - h[n] x[n+1] = g[n] + h[n]                          (2)

 

g[n] және h[n]  шығыстық дәйектіліктері артық мәліметтерді құрайды. Сонымен, x[n] бастапқы дабылын жаңғырту үшін тек тақ немесе тек қана жұп іріктемелерді алған жеткілікті екені айқын. Әдетте, жұп іріктемелер алынады. Сонымен, x[n] бастапқы дабылы тек мыналардан құралады:

g[0], g[2], g[4], .... h[0], h[2], h[4], .....

x[0] = g[0] - h[0]

x[1] = g[0] + h[0] x[2] = g[2] - h[2] x[3] = g[2] + h[2] және тағы сол сияқты...

Төмен жиілікті фильтрдің шығуы бастапқы дабылдың дөрекі аналогиясын құрайды. Егер бастапқы дабыл ретінде кескін болса, онда төмен жиілікті фильтр шығысы жерінде төмен рұқсатты шайылған, тиянақсыз кесікн пайда болады. Жоғары жиілікті дабыл шығысы кескінге бөлшектерді қосады. Төменжиілікті фильтрдің шығуымен қоса бастапқы кескін оқылатындай жаңғыртылуы мүмкін. бастапқы дабылдың дөрекі қалпы (төмен жиілікті фильтр шығысындағы дабыл) кей кездерде негізгі деңгей (base layer), ал қосымша бөлшектену дабылы – жақсару дәрежесі (enhancement layer) деп те аталады. Жоғары жиілікті фильтр h[n] шығысындағы дабыл бірнеше фильтрлер арқылы жіберілуі мүмкін, осылайша, x[n] бастапқы дабылының қажетті бөлшектенуі жүзеге асырылмайынша қайталануы мүмкін. алайда бұл жерде ешқандай да қысқартылуы болмайтыны анық. Түрлену бастапқы дабылдағы болған дәл сол биттердің санын жаңғыртады. Шығыстық мәндер түрлену коэффициенттері немесе  wavelet–түрлену коэффициенттері деп аталады.

Хара түрлендіруі негізінде кескінді қысқарту облысында қолданылады. Басқа мақсаттарда одан да күрделі түрлендіру фильтрлері қолданылады. Қысқартылу негізінде қосымша бөлшектену дабылына кейбір квантизация қалыптарын (скалярлық және векторлық) қолданумен жүзеге асады. Ары қарай түрлендірудің алынған коэффициенттеріне кодтаудың ықтималдылық (энтропийлық) техникасы қолданылады.

Жоғарыда келтірілген мысалда x[n] кірістік дабылы жартылай тонды кескіндердің растр іріктемелерінің 8–биттік дәйектілігін құрайды деп ұйғарайық. g[n] төмен жиілікті  фильтр шығысы үшін енді сол 8 битті, ал жоғары жиілікті h[n] үшін –  одан төменін, мысалы  4 бит қолдануға болады. бұл негізінде скалярлық квантизация. Ары қарай жоғары жиілікті фильтр шығысы нөлге ұмтылады, себебі түрлендіру коэффициенттері алгоритмді қолдану шамасына қарай кеми бастайды. Осылайша, h[n] бөлшектену дабылына ықтималдылық кодталуын қолдануға мүмкін болады.

Негізінде көптеген нақты кескіндер үшін  g[n] дабылы төмен жиілікті фильтр шығысы кезінде контур шекараларынан бөлек алдыңғы g[n–1] іріктемесіне ұқсас болады. Беттік шағылысудан нақты нысандар қатысты тұрақты коэффициенттерге ие болу салдарынан, g[n] осылайша g[n–1]–ге ұмтылады.

Кадрлар айырмашылығы

Кадрлар айырмашылығы технологиясын қолданатын компрессорлар болып табылады: Cinepak.

Артықшылықтары мен кемшіліктері:

- негізінде тәуелсіз бөлек кадрларды қысқартуға қарағанда жақсы қысқартуды қамтамасыз ете алады;

- кодтау нәтижесінде пайда болатын қателер жиналып, қосымша кілттік кадр болуын талап етеді.

Кадрлар айырмашылығының алгоритмі көптеген жағдайларда кескіндер кадрдан кадрға өту абрысында айрықша ерекшеленбейтіндігінің мәнжағдайын қолданады. Алгоритмді қолдану шамасына қарай әрбір келесі кадрды кодтауға және сонымен қатар төмен коэффифиенттерге алуға арналған векторлық квантизацияны қолдану шамасына қарай қиын кодталудан кадрларға ақырын қателер түседі. Бұл бейнеқатарға алдыңғы кадрларды ескерместен кодталатын және бейнедегі «тіректік нүктелер» болып табылатын кілттік кадрлардың қосылуын талап етеді.

Қозғалыстың орнын толтыру

Қозғалыстың орнын толтыру технологиясын қолданатын коспрессорлар: MPEG–1,2 және 4.

Артықшылықтары мен кемшіліктері:

- кадрлар айырмашылығы механизмімен салыстырғанда қозғалыстың орнын толтыру механизмі қысқартудың жоғары дәрежесіне жетуге көмектеседі;

- кодталу көп еңбекті қажет етеді және арнайы аппаратураларды талап етеді;

- қозғалыстың орнын толтыру технологиясы  MPEG, H.261 және H.263 сияқты халықаралық сандық бейнені қысқарту стандарттарында қолданылады;

- ең көп қысқартылу төмендетілген қозғалысты сахналарында жүзеге асырылады.

Қозғалыстың орнын толтыру көптеген күрделі алгоритмдерді қолдану негізінде жасақталған. Қысқартудың аталған технологиясы тиімді болатын орта, әдетте, нысан қозғалмайтын фонға қатысты орнын ауыстыру арқылы бейнеқатарға негізделеді. жақындалатын немесе өшірілетін (камера бойынша қозғалатын) қалпы бойынша өзгертілетін нысандар  қозғалыстың орнын толтыру алгоритмі арқылы тиімді қысқартуға жете алмайды. Қысқарту кескін элементтерінің жаңа координат мәліметтерінің үлкен мәндерін сақтаудың орынан элементтерді араластыру векторын келтірумен мүмкін болады. Негізгі блок болып (қалған блоктардың араластыру векторы қатысты қойылатын) кодталатын (болжамдалатын) блокқа қатты ұқсас болатын, 16x16 пиксель өлшемдегі кез келген блок болуы мүмкін. Осылайша басқа кадрлар жіберілетін кадр алдын ала декодталуы тиіс. Алайда тіректік кадр болжамдалатын кадрдың алдында болуы қажет емес. MPEG екі бағытта да B– (bi–directiоnally predicted) кадрларды енгізу арқылы болжамдай алады.

 

 

3 Сығудың стандарттары

 

 

MPEG -1 - JPG кодекінен негізі алынған дүние жүзіне танымал формат. Ондағы қысқартылу үш кадрдан серия бойынша жүзеге асады. Бұл «әлсіз» машиналарда да бейнені стереодыбыспен осы форматта қарауға болатын өте ескі кодектердің бірі. Алайда кескіннің сапасы да жоғары емес: ол VHS теңдес форматымен салыстырылады. Кескін 352х288 нүктелер рұқсатына ие, сапасы да өте жақсы деп айта алмаймыз. MPEG–1 ресурстарға талаптанбайтын болғанымен оның тағдыры шешілген: компьютерлер мен интернетте мәліметтерді жіберу сыйымдылығы мен жылдамдылығының дамуымен формат ұмтыла бастайды.

Бұл форматта мәліметтерді қысқарту қалай жүзеге асады?  бізде келесі бір сахна бар деп болжамдайық: көлік «А» пунктінен «Б» пунктіне қозғалып келе жатыр. Машинаның орын ауыстыруын екә параметрлермен сипаттауға болады: «А» пунктінен «Б» пунктіне векторлық орын ауыстыру мен өз осі бойынша айналу бұрышы. Артқы жоспар бұл жағдайда өзгеріссіз немесе жартылай өзгеріссіз болады - көрермен ар жақтағы ағаштардың бұтақтарының толқуына назар аудармайтын болар. Сәйкесінше, кадрды екі құраушы бөліктерге бөліп тастауға болады – бір рет қана сақталатын және содан соң барлық кадрдың жаңғыртылуында келтірілетін артқы жоспар, машина қозғалатын облыс – оны әр кадр үшін арнайы жазу керек болады.

MPEG–1 форматында бейнероликтің  барлық кадрлары үш түрге бөлінеді: I, P және B–кадрлары. Бірінші түріне (I–кадрлар, Intra Frames) тіректік кадрлар  жатқызылады. Олардың кескіндері  толық көлемде JPEG форматында сақталады. P–кадрлар (Predicted Frames) үшін ең аз  дисктік кеңістікті қажет ететін  алдыңғы болған i–кадрдан айырмашылығы  жазылады. B–кадрлар (Bi–Directiоnally Interpоlated Frames) үшін алдыңғы I– немес P–кадрлар арасындағы айырмашылықтар жазылады (сурет 6).

 

 

Сурет  6. I, P және B кадрлары

 

Нәтижесінде қысқартылған файл форматы шамамен бастапқыға қарағанда 1/35 құрайды. Бұл VHS кассетасындағы бір ажрым сағаттық сапасы эквивалентті теңдес MPEG–1  форматында жазылған фильм екі компакт–дискке орналасады. Internet немесе спутниктік хабар тарату желілері арқылы жіберу үшін аталған стандарт әрине жарамайды.

MPEG–2 жоғарыда аталған MPEG–1 форматының ары қарайғы кеңейтілуі  болып табылады. онда ұсынылатын  кадр өлшемі жоғарылатылған –  енді ол 1920 x 1080 нүктелерді құрайды, алты арналы дыбыстық қолдау  қосылған. Алайда бейнені аталған  форматта жаңғырту үшін компьютердің  одан да жоғары есептеу қуаттылығы  керек болады.

MPEG–3 стандартын құрастыру  туралы жұмыстары жасалғаны туралы (MPEG–1 Audiо Layer 3 әйгілі дыбысты қысқарту форматымен шатастырмау керек) ескерген жөн. Ол HDTV жоғары айқындылықты сандық теледидар жүйесі үшін базалық болуы тиіс еді. Бірақ аталған формат туралы жұмыстар HDTV талаптарына сай көп емес  MPEG–2 кеңейтілуін қолдану арқасында тоқтатылған болатын.

Информация о работе Цифрлық бейненің негізгі мінездемелері