DjVu (фр. déjà vu — «бұған дейін көрілген») — сканерден өткізілген құжаттарды - кітап, журнал, қолжазба және басқаларды сақтау үшін жасалған технология.

DjVu
Файл кеңейтімі:.djvu, .djv
MIME түрі:image/vnd.djvu, image/x-djvu
Type code:DJVU
Дамытқан мекеме атауы:AT&T Labs - Research
Формат типі:Кескінді файл форматтары


Бұл технология формула, сызбанұсқа, сурет және қолжазба символдарына бай әрі символдардың оптикалық оқылуына қиындық туғызатын материалдардың кескіндерін сапасыз сығу жолымен жасалынады. Және де бұл форматтың қолданысы рәсімделудің маңыздылығын көрсету жағдайында ұтымды, мысалға, тарихи құжаттардың мазмұнынан бөлек, қағаздың сапасын: түсін, сынын; пергаменттің ақаулары: жарықшаларын, бүктелген орындарын, түзетулерін, сияның аққан жерлерін, саусақ іздерін және басқа да заттардың қалдырған іздерін көрсету үшін.

Қазіргі таңда DjVu бірнеше электронды ғылыми кітапхананың негізгі форматына айналды. Ол айтарлықтай белгілі және оның негізінде электронды құжаттардың біразы жасалатын болды.

Форматтағы желі бойынша алмасу ерекшеліктері файлдың жүктелуі аяқталмағанды күтпей-ақ беттерді көре алу мүмкіндігін ескере жасалған. DjVu-файлы мәтіндік (OCR) қабаттан тұруы мүмкін әрі бұл файл бойынша толыққанды іздеу жүргізуге мүмкіндік туғызады. Бұдан бөлек, DjVu-файлда енгізілген интерактивті мазмұн мен белсенді аумақтар — сілтемлер болуы мүмкін, бұл DjVu-кітаптардағы ыңғайлы навигацияның атқарылуына мүмкіндік береді.

Қолданылатын технологиялар

өңдеу

Түрлі-түсті кескіндерді сығу үшін DjVu-да шығыс кескінін үш қабатқа: алдыңғы бөлік, артқы бөлік және ақ-қара түсті (бір биттік) маскаға бөлетін арнайы технология қолданылады. Маска әуелгі файлдың рұқсаттығымен сақталады; себебі мәтіннің кескіні мен басқа да анық детальдарды құрайтын соның дәл өзі. Қалған, беттің суреттері мен бет текстурасын құрайтын артқы бөлік, орын үнемділігі үшін сартты баптаулармен сақталады. Алдыңғы бөлік маскадағы түстік мәліметтерді сақтап отырдаы, оның рұқсаттығы әдетте одан бетер қысқартылады. Осыдан кейін, артқы және алдыңғы бөліктер вейвлет-түрлену арқылы, ал маска — JB2 алгоритмі арқылы сығылады.

JB2 алгоритмінің ерекшелігі — оның беттегі қайталанатын символдарды іздеп, олардың кескіндерін тек бір мәрте сақтауы болып табылады. Ал көп беттік құжаттарда болса қатарынан келе жатқан беттер ортақ кескін «сөздігін» қолданады.

Көптеген кітапты сығу үшін тек екі түстің өзі жеткілікті. Бұл жағдайда ұтымды сығылуға қол жеткізудің амалы — бір қабатты ғана қолдану. Тұрпайы, ақ-қара түсті суретті, 600 dpi рұқсаттықпен сканерден өткізілген кітаптың орташа көлемі 15 Кб, шамасын құрайды, яғни түпкі файлдан 100 есе кем. Күрделі артқы қабаттың қолданысында көлем ұтысы әдетте 4—10 есені құрайды. Алайда, DjVu-дің стандартты баптауларында мәліметтерді сапалық шығынымен сығу қолданылады, сол себептен аса маңызды құжаттар үшін сапаны сақтай отырып сығу қолданылады, ол үшін PNG, JPEG 2000, TIFF, т.с.с. қолданылады. DjVu-де сонымен қатар сапаны сақтай отырып мәліметтерді сығуды да қолдануға болады. Мысалға DjVuLibre пакетіндегі CJB2 қондыртпасы сондай мүмкіндікті береді.

DjVu форматының негізінде AT&T Labs тарапынан жасалған келесідей технологиялар бар:

  • сканерден өткізілген кескін мәтінін аядан ажырату алгоритмі;
  • аяны сығудың IW44 вейвлетті алгоритмі;
  • ақ-қара түсті кескіндерді сығудың JB2 алгоритмі;
  • ZIP-ті сығудың әмбебап алгоритмі;
  • «сұраныс бойынша» орналастыру алгоритмі;
  • кескіндерді «тасалау» алгоритмі.

DjVu кескіндерін мәтіндік ұсыну

өңдеу

DjVu форматы беттегі мәтінді құрайтын "мәтіндік қабаттың" болуын ескереді. (Соның көмегімен жұмыс істеу кезінде іздеу мен мәтінді жеңілдей көшіріп алу үшін қолданылады). Егер мәтіндік қабатқа қол жетімсіз жағдай туса, мәтінді алудың бірден-бір жолы — шет қондырмалы бағдарламаларда оптикалық оқыту жасату.

Лицензиялық ақпарат

өңдеу

AT&T өз технологиясын LizardTech компаниясына сатқан болатын, ал кейінгісі оны өзінің коммерциялық мақсаттарында қолдануға тырысқан, алайда форматтың ашықтығына байланысты[1] DjVu құжаттарын құру әрі тамашалау үшін түрлі тұғырнамаларға қолжетімді еркін бағдарламалық қамтамасыз ету құралы бар болып шықты. 2008 жылдың 1 шілдесінде LizardTech DjVu менеджментін Celartem аналық компаниясына берген болатын[2], ал 2009 жылдың 10 маусымында Celartem DjVu технологиясына қатысты құқықтарды Caminova компаниясына тапсырды[3].

Бұлардан бөлек GNU GPL лицензиясы негізінде жарияланатын ішіндегі кодтаушы-бағдарламалары әрі оларды тамашалайтынDjVuLibre кітапханасы сынды ашық бағдарламалық қамтамасыз ету құралы бар.

DjVu-мен жұмыс істеуге арналған бағдарламалар

өңдеу
Көру үшін

Windows-қа

Linux-қа

Android-қа

iOS-ға

BlackBerry_OS-ға

Түзету үшін
Құру үшін
Түрлендіру үшін

Тағы қараңыз

өңдеу

Дереккөздер

өңдеу

Сыртқы сілтемелер

өңдеу