Переклад
В даний час у зв'язку зі швидким розвитком Інтернету як засобу обміну великими обсягами текстової інформації, а також у зв'язку з необхідністю все оперативніше обробляти цю інформацію особливо гостро стоїть питання про мову. Звичайно, значна частина інформації подається на англійському - загальноприйнятій мові міжнаціонального спілкування. Але і на інших мовах світу є дуже велика і важлива частина інформації. Тому надзвичайну значимість і цінність здобуває можливість міжмовної комунікації.
Сьогодні на ринку мається багато виробів, що відносяться до різних розділів мовної інженерії, що займається створенням інструментарію, що допоможе користувачам, по-перше, розуміти одержувану інформацію, а по-друге, поставляти свої документи на максимально великому числі мов. Це, наприклад, програми перевірки орфографії і граматики, програми автоматичного перекладу, системи диктування, пакети інформаційного пошуку.
Автоматичний переклад часто викликає дорікання з приводу «глупостей», що пише програма: переклад імен власних, неправильна структура пропозиції, відсутність зв'язку іменника з прикметником і т.д. Дорікання цілком закономірні, але при цьому не враховується, що автоматизований переклад несе в собі ряд явних переваг, треба тільки вміло ними скористатися. До числа незаперечних переваг відносяться швидкість і порівняльна, щодо ручного перекладу, дешевина обробки тексту. Не таку очевидну, але на практиці все-таки користь приносить горезвісний «дослівний» переклад. Те, що машина не може, на відміну від професійної перекладача-людини, надати високомистецький або хоча б просто зовсім зв'язний текст, безумовно, погано, особливо для користувачів, що не знають мову. Але зате будь-яка розсудлива людина, знайшовши запропоновану йому нісенітницю, спробує розібратися, у чому ж справа і як повинна бути правильно. Професійний же перекладач явно не стане писати нескладний текст навіть у тому випадку, якщо він неправильно його зрозумів. Він художньо обробить його так, як порахує потрібним, і замовник, природно, не зможе відфільтрувати помилки відразу, а можливо, і потім. Ризик виникнення помилок підвищується у випадку вузкоспеціалізованого перекладу, коли потрібно не просто висококласний перекладач, але і гарний фахівець у конкретній області, будь то теоретична економіка, математичне моделювання або що-небудь інше.
Насправді, як показує досвід, автоматизованими перекладачами треба користуватися, у визначеному змісті, як словниками-підказувачами, тобто для створення чорнового варіанта тексту, що підлягає надалі коректуванню користувачем — фахівцем у даній області. Для цього зручно розбивати екранну сторінку на дві частини: одночасно в одній з них буде знаходитися уміст вихідного тексту, в іншій — переведеного.
У листопаді 1999 року комп'ютерний журнал «PC Expert» провів порівняльне тестування найвідоміших систем машинного перекладу: Power Translator (компанія Lernout&Haspie), Reverso/PROjectMT (компанія ПРОМТ), Systran (компанія Systran) і Transcend (компанія Transparent Language). Використовувалися тексти по інформатиці, філософії, медицині, юриспруденції, релігії (використовувалися тексти з Біблії), а також витримки з художніх творів. Дане дослідження було корисно з погляду надання інформації:
• по-перше, про те, які переклади може виконувати автоматизований перекладач;
• по-друге, наскільки якісно або неякісно він може це робити в середньому;
• по-третє, на що, на які критерії і проблеми потрібно звертати особливу увагу, користуючись такою системою.
Основні функції програм-перекладачів:
• збереження у вигляді файлу як оригіналу, так і перекладу;
• виведення на друк вмісту оригіналу і перекладу;
• копіювання в Clipboard (буфер обміну) вмісту оригіналу і перекладу;
• можливість зміни напрямку перекладу;
• можливість зміни списку використовуваних словників;
• робота зі словами, що не вимагають перекладу;
• робота зі списком незнайомих слів;
• можливість формування запиту до пошукових серверів рідною мовою.
Пошук в Інтернеті. Досить сформувати запит рідною мовою, а система переведе його на зазначену мову і відправить на один з найбільш популярних пошукових серверів. Три рівні формування запитів — «Простий», «Складний», «Професійний» — допоможуть швидко створити запит практично будь-якої складності.
Підключення додаткових спеціалізованих словників. Якість перекладу можна значно поліпшити, якщо використовувати при перекладі текстів:
• спеціалізовані словники, розроблені системою для перекладу;
• користувальницькі словники, створені самим користувачем у системі.
Багато програм є системою, що самонавчається, суть якої полягає в тому, що користувач по ходу перекладу може виправляти варіанти, які його не влаштовують, слова, словосполучення, додаючи правильний варіант у словник, і програма надалі буде розпізнавати такий же шматок тексту так, як треба користувачеві.
Класифікація систем обробки текстів
В даний час робота з текстовими документами в основному виробляється за допомогою персональних комп'ютерів, що є зручним і надійним методом. Програмне забезпечення, призначене для обробки документів за допомогою комп'ютера, називається текстовими процесорами. Текстові процесори можуть класифікуватися за багатьма ознаками. До основного з них можна віднести наступні:
- кількість алфавітів, який можна використовувати;
- форма представлення тексту;
- спосіб використання;
- призначення.
По кількості алфавітів, що використовуються одночасно, розрізняють одне- і багатоалфавітні системи. Одноалфавітні системи допускають одночасну роботу з текстом тільки на одній мові (приміром, англійській, російській й ін.). Найбільше часто їх використовують в операційних системах і їхніх оболонках. У багатоалфавітних системах робота може одночасно вестися на різних мовах. Однак, робота з ієрогліфічними текстами (китайським, японським), а також з текстами на деяких інших мовах (наприклад, арабському, що допускає введення символів праворуч ліворуч) досить специфічна.
одноалфавітні лінійні
багатоалфавітні нелінійні
загального призначення
автономні спеціального призначення
мережні
За формою представлення тексту системи підрозділяють на лінійні і нелінійні. У лінійних системах представляється тільки "чистий" текст, тобто текст, що зображується символами використовуваних алфавітів і синтаксичних знаків. Такі системи не допускають індексів, показників ступеня, математичних формул тощо. Лінійні процесори особливо інтенсивно використовують у діловодстві, журналістиці й у деяких інших сферах. У нелінійних системах крім алфавіту, синтаксичних знаків і символів псевдографіки використовують ще широкий набір спеціальних знаків, а саме: знаки інтеграла, кореня квадратного, символи для побудови малюнків тощо. Нелінійні системи допускають запис "багатоповерхових" математичних виражень, індексів, складних малюнків і ін. Ці системи використовують в основному для роботи з науковим текстом.
За способом використання системи можна розділити на автономні і мережні. Автономні системи використовує кожен користувач окремо для рішення своїх специфічних задач. Текстова інформація в таких системах є індивідуальною. Мережні системи використовують підприємства, установи, фірми. Текстова інформація може передаватися по локальній мережі, тобто вона доступна багатьом користувачам. Право внесення зміни в той або інший документ може здійснюватися по спеціальних паролях, привласненим користувачам. Ці системи скорочують паперовий документообіг і в майбутньому можуть привести до безпаперової технології.
По призначенню системи підготовки текстів доцільно розділяти на системи загального і спеціального призначення. Системи загального призначення орієнтовані на широке коло користувачів. Вони прості в роботі і не вимагають спеціальних знань. Ці системи часто використовують у повсякденній діяльності установ службовці, вчителя, аспіранти і ін. У більшості випадків системи загального призначення це автономні системи з лінійною формою зображення тексту. До систем спеціального призначення насамперед варто віднести системи, орієнтовані на роботу з науковим текстом, а також видавничі системи. Робота з такими системами вимагає спеціальної підготовки. Вони мають великий набір символів різних алфавітів, шрифтів і спеціальних знаків, що дозволяє зображувати різноманітну інформацію. Деякі з цих систем здійснюють перевірку і корегування орфографічних помилок за допомогою зіставлення кожного слова тексту зі словником. У випадку виявлення розбіжності неправильно написані слова можуть змінюватися. Окремі системи мають словники, що містять більше 100 тис. слів.
Не викликає сумніву, що кожний з перерахованих вище класів текстових процесорів має багато переваг у порівнянні з традиційними засобами підготовки текстів. Усі вони надають різноманітні можливості для роботи з документацією, а деякі — навіть інтелектуальні послуги.
Останнім часом з'явився новий напрямок розвитку текстових процесорів, зв'язаний з обробкою структурних текстів (гіпертекстів). У гіпертексті будь-який його фрагмент може мати більш глибокий і детальний опис на наступних рівнях. Іншими словами, предмет або явище розкриваються "вшир і всередину", а користувач може легко "бродити" по різних його розгалуженнях.
3. Програмні засоби для роботи з текстом
Текстові редактори- найпростіші програми, призначені для самого примітивного редагування тексту. Як правило, вони не мають розвинутих засобів форматування. Класичним прикладом текстового редактора є Windows Notepad.
Текстовий редактор Chiwriterмає широкий набір символів. Крім російського і латинського алфавітів передбачені грецький алфавіт, математичні знаки й інші спеціальні символи. Даний ТР дозволяє легко розробляти нові символи, зручний для роботи з математичними і хімічними формулами.
Редактор MultiEditдозволяє одночасно працювати з великим числом документів (до 100). Даний ТР доцільно використовувати для складання програм на мовах програмування Assembler, Pascal, Basic, тому що він може перевіряти синтаксис програм, що складаються.
Вітчизняний редактор Лексикон(автор — Е.Н.Веселов) може одночасно працювати з десятьма документами, що знаходяться в різних вікнах. Розміри останніх, а також їхнє розташування можна змінювати на власний розсуд.
Текстові процесори.Якщо говорити про загальносвітову практику, то основними інструментами для підготовки текстових документів є процесори Word компанії Microsoft, Word Perfect фірми Corel, а також пакет StarOffice, розроблений німецькою компанією StarDivision GMBH.
Текстовий процесор Microsoft Word for Windows частіше називають MS Word.Цей редактор практично витиснув з вітчизняного ринку інші текстові редактори. Він використовує всі прогресивні принципи, закладені в операційну систему Windows, наприклад принцип WYSIWYG. Завдяки цьому принципові проблема вибору шрифту практично не турбує користувача. Механізм зв'язування і вбудовування об'єктів — OLE — робить убудовування малюнків у текст простою і природною дією.
Word 2000 є найбільше часто використовуваним у даний час текстовим процесором, оскільки являє собою додаток MS Office 2000 — розробки компанії Microsoft, що проводить політикові активного упровадження своїх продуктів по країнах СНД за рахунок підтримки російської мови і створення русифікованих версій. У листопаду 1992 р. компанія відкрила представництво по країнах СНД, у задачі якого входять розвиток ринку програмного забезпечення на території колишнього СРСР, а також впровадження і локалізація новітніх технологій.
Перші версії MS Word з'явилися в середині 80-х років. У той час цей текстовий процесор працював у середовищі MS DOS. Остання DOS-версія цього продукту носила номер 5.0 і могла працювати в графічному режимі. Перша Windows-версія з'явилася з виходом Windows 3.0. Усі подальші Windows-версії цього продукту відрізняються гарною інтеграцією з операційним середовищем і іншими продуктами MS Office — пакетом офісних програм Microsoft. Версія 7.0 (Word 95) була першим текстовим процесором, що цілком використовував можливості нової ОС. Наступна версія, 8.0, мала ряд поліпшень, основними з яких були удосконалені засоби інтеграції і настроювання, а також новий формат файлів DOC. Також там уперше з'явилася можливість роботи з форматом HTML, що пізніше стало здобувати усе велику важливість.
Microsoft Word 2000 із самого початку розроблявся як інструмент, за допомогою якого користувачі в будь-якій країні світу могли б легко і просто створювати не тільки звичайні друковані документи, але і повідомлення електронної пошти, а також документи для публікації в World Wide Web. HTML обраний у Word 2000 у якості одного з основних форматів створюваних файлів, що сприяє подальшому закріпленню ведучого положення цього додатка в області створення Web-документів і повідомлень електронної пошти.
У порівнянні з попередніми версіями Word 2000 має також ряд переваг, що носять не настільки радикальний характер: поліпшені засоби автоматичної перевірки орфографії, табличні і графічні інструменти, значно модернізований Web-інструментарій.
Для видання книг і інших типографських матеріалів використовуються видавничі системи Page Maker, QuarkXPress і Ventura Puplisher.
Програми перевірки правопису і граматики(спеллеры, або спелчекеры від spelling checking — перевірка орфографії), такі, як «Орфо»(її аналог убудований у російську версію Microsoft Word), SpellRus, «Коректор», «Арф», Lingvo Corrector, «Дієслово», «Пропис»дозволяють умонтувати перевірку правопису і граматики в багато редакторів документів і у видавничі системи.
Програми-перекладачі— з англійської, німецької, французької й інших мов на українську і назад (Stylus і PROMTфірми ПРОМТ, Сократфірми Арсеналь і ін.).
Російська компанія ПРОМТ виступає практично монополістом по упровадженню своїх розробок. Докладніше розглянемо останні варіанти системи.
Magic Gooddy — це новий мультимедийный англо-російсько-англійський перекладач компанії ПРОМТ. Gooddy швидко переводить фрагменти тексту, що перетаскується мишею на його зображення.
Редактор цього перекладача надає як стандартні, так і порівняно нові, малореализуємі можливості:
• підготувати і відправити лист по електронній пошті;
• перевести і зберегти текстовий файл;
• створити лист з анімацією;
• перекласти текст, набраний із клавіатури.
Також він може розпізнавати команди, що віддаються йому голосом. Словниковий запас Gooddy на дійсний момент нараховує більш 500 тис. слів. Цим перекладачем зручно користуватися, наприклад, «у домашніх умовах», створюючи не дуже громіздкі, але нестандартно оформлені документи.
Pocket PROMT (1.0)забезпечує зв'язний переклад текстів з англійської мови на російську і навпаки. Система побудована на новітніх лінгвістичних розробках компанії ПРОМТ. Вона підтримує можливості, надані портативними комп'ютерами. Це дуже зручно тим, хто змушений знаходитися в частих роз'їздах і одночасно зв'язаний з перекладом великих або складних текстів.
Програми-словники («Контекст»фірми Інформатик, Доультилексфірми Медіа Лінгва, Лінгво (Lingvo)фірми Біт, «Росіянин філолог», «Рута», «Плай» і ін.
Програми розпізнавання образів(їх називають OCR-програми).Завдяки їм можна використовувати сканер для введення не тільки картинок, але і текстів. Ці програми вміють на картинці впізнавати букви і зчитувати з зображення текст. Програми розпізнають тексти на російській, англійській, німецькій і французькій мовах, у тому числі змішані тексти. Якість розпізнавання дуже залежить від якості тексту.
До них відносяться CuneiForm(фірми Cognitive Technologies), FineRider(фірми ABBYY) і ін. Поділяються вони на дві групи — ті, яких навчають, і ненавчальні.Перші треба спершу навчити розуміти той або інший шрифт, пояснити, що от цей символ — буква Ю, а от ця — Я. Після такого навчання програма вже сама намагається ту або іншу форму пізнати як букву. Програми другого типу оснащені великим набором описів шрифтів і математичним апаратом, що дозволяє привести невідомі шрифти до уже відомих, так що для більшості текстів витрачати час на навчання не приходиться. Клас таких програм визначається відсотком помилок при роботі з оригіналами низької якості (якщо помилок, 20% від загального числа символів, то працювати з програмою практично не можна), чутливістю до того, прямо або косо — і наскільки косо — вставлений у сканер оригінал, здатністю працювати з текстами, набраними в декілька колонок, і з текстами на різних мовах, а також наявністю убудованого Spell-Checker'а, що різко прискорює виловлювання наявних помилок. Деякі програми не просто зчитують текст, але і визначають накреслення — нормальний, курсивний, напівжирний або підкреслене — яким був набраний той або інший шматок, і відтворюють ці шрифтові виділення у вихідному файлі.
Ще одне застосування програм розпізнавання образів — зчитування інформації з телефаксу.Так, програма FaxLineдля обслуговування факсимільного зв'язку забезпечується OCR-програмою, що дозволяє автоматично вводити в комп'ютер не зображення факсу, а текст його.
В даний час ведеться активна розробка програм розпізнавання рукописних текстів. Такі програми, як правило, є самонастроювальними, як ірозпізнавання мови, щоз'явилися вже на ринку програми. Одним із прикладів, може бути система автоматичного розпізнавання російської мови «Горинич». Дана програма дозволяє здійснювати голосове введення текстів у комп'ютер у будь-якому текстовому редакторі, що працює під операційними системами Windows 95/NT, а також здійснювати голосове керування комп'ютером. Як ядро системи використовується найвідоміша і широко використовувана американська програма Dragon Dictate. Швидкість голосового набору текстів залежить від продуктивності комп'ютера і може досягати 500—700 друкованих знаків у хвилину, що значно перевищує швидкість «сліпого» методу друкування. При цьому система «Горинич» здійснює автоматичний контроль правопису: у текстах, уведених з її допомогою, виключені орфографічні помилки.
Структура та призначення програмного комплексу Microsoft Office. Текстовий процесор MS Word: запуск (головне меню, ярлик). Вікно програми MS Word і вікно документа. Два набори кнопок у правому верхньому куті вікон, призначення й приналежність.
Основні елементи вікна програми MS Word. Заголовок вікна, рядок меню, панелі інструментів. Вид вікна програми і його настроювання. Панелі інструментів "Стандартная", "Форматирование". Лінійки.
Вид і настроювання вікна документа: режими "Обычный/Разметка страницы/Электронный документ". Смуги горизонтального й вертикального прокручування, символи, що не друкуються, границі області тексту у вікні документа. Панель інструментів "Стандартная" і її кнопки - дублікати популярних команд меню.
Група команд "Создать, Открыть, Сохранить" документ. Тріада команд відкриття та збереження документа: "Папка, Имя файла, Тип файла".
Набір і редакторське виправлення тексту документа в Word. Розкладка на клавіатурі символів мови (букв, розділових знаків), зміна мови розкладки, регістр букв і символів. Розділові знаки на клавіатурі.
Пробіл для поділу слів і речень. Правила написання розділових знаків. Нерозривний пробіл. Поняття абзацу, символ абзацу і його роль. Автоматичний перенос слів і заборона на переноси.
Виділення тексту (клавішами керування, курсором, мишею). Операції із фрагментом за допомогою миші: зачепити, перемістити, копіювати фрагмент. Буфер обміну. Перенос, копіювання фрагментів через буфер обміну у середині вікна документа, між вікнами окремих документів програми Word і між різними програмами - додатками Windows. Група команд ("Вырезать, Копировать, Вставить").
Скасування команд. Створення нового документа. Команда "Окно", перехід між вікнами одного документа і декількох документів.
Форматування виділеного тексту, чи того, що набирається. Поняття формату. Команда "Формат". Шрифт (вкладки й перемикачі вікна команди). Параметри шрифту: гарнітура, насиченість, нахил, розмір, колір, інтервал між буквами, верхній/нижній індекс. Кнопки і рядки на панелі "Форматирование" для шрифту (включаючи колір).
Формат, Абзац (вкладки і перемикачі вікна команди). Параметри абзацу: вирівнювання, перенос, інтервали: міжрядковий і міжабзацний. Команди меню і кнопки на панелі "Форматирование" для вирівнювання абзацу. Форматування за зразком (копіювання формату). Границі, заливання.
Списки й виноски. Поняття списку та його варіанти: маркірований, нумерований, багаторівневий. Правила оформлення тексту у виді списку. Маркер списку. Кнопки на панелі "Форматування" для списків. Завершення списку і видалення ознаки списку для конкретного абзацу. Виноски, варіанти і правила оформлення.
Автоматичний пошук і заміна заданого набору символів у тексті. Різні режими пошуку і заміни. Використання заміни для видалення повторюваних помилок. Робота з закладками.
Правопис: орфографія і граматика. Перевірка правопису правою кнопкою миші. Настроювання і повторна перевірка правопису. Синоніми.
Великий багатосторінковий документ, структура документа. Поняття стилю тексту. Набори стилів. Стиль "Обычный". Стиль "Заголовок n-го уровня важности". Типові відповідності заголовків і їхніх рівнів важливості в звітах, книгах, дипломних роботах.
Параметри сторінки тексту (лист, поля). Режим перегляду макета документа. Нумерація сторінок. Нумерація заголовків як списків. Вставка розриву сторінок. Зміст документа, розташування і відновлення. Створення публікації.
Текстовий редактор в офісній роботі юриста. Ділові листи, злиття. Бланкові документи професійної якості з великим заощадженням часу (шаблони: заповіт, доручення, контракт, апеляція, інформаційний бюлетень, повістка).
Робота з таблицями. Вставка таблиці в текст документа. Панель інструментів "Границы и заливка". Установка рамок таблиці. Заливання осередків фоном заданого кольору і візерунка. Об'єднання осередків. Зміна висоти рядків і ширини стовпців у таблиці. Сортування. Стовпчики тексту без таблиць. Табуляція.
Графічні засоби і графічні додатки до Word. Вставка символів, малювання, написи, автофігури. Вставка малюнка в документ. Створення фігурного тексту. Формат графічних об'єктів (розмір, положення, обтікання, прив'язка, формат ліній і заливання). Виділення, редагування, переміщення, пошарове розміщення графіки.
Лекція № 2
Тема: Введение в текстовый процессор MS Word
План
1. Краткая характеристика текстового процессора Word.
2. Запуск и прекращение работы в процессоре.
3. Организация интерфейса процессора: окно процессора, панели инструментов, режимы просмотра, набора и редактирования документов.
4. Использование справочной системы редактора.
Основна література
1. Інформатика: Базовий курс/ С.В.Симонович і ін. – Спб.: Питер, 2001.–640с.
2. Руденко В.Д., Макарчук А.М., Патланжоглу М.А. Курс інформатики / Під ред. Мадзигона В.Н. – К.: Фенікс, 1998. – 368 с.
3. Шафрин Ю.А. Інформаційні технології: У 2ч. : Основи інформатики й інформаційних технологій. – М.: Лабораторія Базових Знань, 1999. – 320с.
4. Угринович Н.Д. Інформатика й інформаційні технології. Навчальний посібник. – М.: Лабораторія Базових Знань, 2000. – 440с.
5. Коляда М.Г. Інформатика і комп'ютерні технології: Навчальний посібник – Донецьк: Батьківщина, 1999 – 608с.
6. Алексєєв А.П. Інформатика 2001. – М.: Солон-Р, 2001. – 365с.
Стислий зміст лекції
Дата добавления: 2015-07-22; просмотров: 686;