Изменение кодировки страницы. Решение проблем с кодировкой в Word

16.09.2024

Ввиду того, что текстовый редактор "Майкрософт Ворд" является самым популярным на рынке, именно форматы документов, которые присущи ему, можно чаще всего встретить в сети. Они могут отличаться лишь версиями (DOCX или DOC). Но даже с этими форматами программа может быть несовместима или же совместима не полностью.

Случаи некорректного отображения текста

Конечно, когда в программе наотрез отказываются открываться, казалось бы, родные форматы, это поправить очень сложно, а то и практически невозможно. Но, бывают случаи, когда они открываются, а их содержимое невозможно прочесть. Речь сейчас идет о тех случаях, когда вместо текста, кстати, с сохраненной структурой, вставлены какие-то закорючки, "перевести" которые невозможно.

Эти случаи чаще всего связаны лишь с одним - с неверной кодировкой текста. Точнее, конечно, будет сказать, что кодировка не неверная, а просто другая. Не воспринимающаяся программой. Интересно еще то, что общего стандарта для кодировки нет. То есть, она может разниться в зависимости от региона. Так, создав файл, например, в Азии, скорее всего, открыв его в России, вы не сможете его прочитать.

В этой статье речь пойдет непосредственно о том, как поменять кодировку в Word. Кстати, это пригодится не только лишь для исправления вышеописанных "неисправностей", но и, наоборот, для намеренного неправильного кодирования документа.

Определение

Перед рассказом о том, стоит дать определение этому понятию. Сейчас мы попробуем это сделать простым языком, чтобы даже далекий от этой тематики человек все понял.

Зайдем издалека. В "вордовском" файле содержится не текст, как многими принято считать, а лишь набор чисел. Именно они преобразовываются во всем понятные символы программой. Именно для этих целей применяется кодировка.

Кодировка - схема нумерации, числовое значение в которой соответствует конкретному символу. К слову, кодировка может в себя вмещать не только лишь цифровой набор, но и буквы, и специальные знаки. А ввиду того, что в каждом языке используются разные символы, то и кодировка в разных странах отличается.

Как поменять кодировку в Word. Способ первый

После того, как этому явлению было дано определение, можно переходить непосредственно к тому, как поменять кодировку в Word. Первый способ можно осуществить при открытии файла в программе.

В том случае, когда в открывшемся файле вы наблюдаете набор непонятных символов, это означает, что программа неверно определила кодировку текста и, соответственно, не способна его декодировать. Все, что нужно сделать для корректного отображения каждого символа, - это указать подходящую кодировку для отображения текста.

Говоря о том, как поменять кодировку в Word при открытии файла, вам необходимо сделать следующее:

  1. Нажать на вкладку "Файл" (в ранних версиях это кнопка "MS Office").
  2. Перейти в категорию "Параметры".
  3. Нажать по пункту "Дополнительно".
  4. В открывшемся меню пролистать окно до пункта "Общие".
  5. Поставить отметку рядом с "Подтверждать преобразование формата файла при открытии".
  6. Нажать"ОК".

Итак, полдела сделано. Скоро вы узнаете, как поменять кодировку текста в Word. Теперь, когда вы будете открывать файлы в программе "Ворд", будет появляться окно. В нем вы сможете поменять кодировку открывающегося текста.

Выполните следующие действия:

  1. Откройте двойным кликом файл, который необходимо перекодировать.
  2. Кликните по пункту "Кодированный текст", что находится в разделе "Преобразование файла".
  3. В появившемся окне установите переключатель на пункт "Другая".
  4. В выпадающем списке, что расположен рядом, определите нужную кодировку.
  5. Нажмите "ОК".

Если вы выбрали верную кодировку, то после всего проделанного откроется документ с понятным для восприятия языком. В момент, когда вы выбираете кодировку, вы можете посмотреть, как будет выглядеть будущий файл, в окне "Образец". Кстати, если вы думаете, как поменять кодировку в Word на MAC, для этого нужно выбрать из выпадающего списка соответствующий пункт.

Способ второй: во время сохранения документа

Суть второго способа довольно проста: открыть файл с некорректной кодировкой и сохранить его в подходящей. Делается это следующим образом:

  1. Нажмите "Файл".
  2. Выберите "Сохранить как".
  3. В выпадающем списке, что находится в разделе "Тип файла", выберите "Обычный текст".
  4. Кликните по "Сохранить".
  5. В окне преобразования файла выберите предпочитаемую кодировку и нажмите "ОК".

Теперь вы знаете два способа, как можно поменять кодировку текста в Word. Надеемся, что эта статья помогла вам в решении вопроса.

Иногда возникает необходимость создания текстового файла в другой системе кодов. Например, для графического редактора PDF программы Works-6 или других программных продуктов. Редактор Word поможет Вам решить эту проблему. Нужно набрать текст так, как делаете обычно, соблюдая необходимую структуру и требования к набираемой информации.

После создания файла, в главном меню редактора заходим в ФАЙЛ, а далее выбираем СОХРАНИТЬ КАК.
В выпадающем окне, кроме возможности определить будущее название файла, будут представлены варианты кодировки файла после сохранения.

Нужно учитывать, что существуют программы, которые не поддерживают переноса слов или строк текста. Поэтому, в данном случае, необходимо писать текст, избегая таких переносов.

Еще одна особенность при возникновении трудностей читаемости текста. Это небольшое отличие 2003 версии Worda от версий более поздних. Появился новый формат текстовых файлов – docx. Его отличие не носит вопрос кодировки, в том смысле, в котором мы его сейчас рассматриваем. И информацию такого рода на старой версии не просмотреть, необходимо обновление редактора.

Иногда открыв файл, созданный при помощи Microsoft Word и присланный нам по почте, скайпу или другим способом, мы вместо привычных русских слов видим какие-то странные иероглифы. Мы недоумеваем, что же такое нам прислали, связываемся с отправителем, а он говорит, что у него все нормально открывается. Суть данной проблемы скорее всего состоит в том, что файл был сохранен не в той кодировке, что стоит по умолчанию в вашей программе. Чтобы исправить ситуацию необходимо всего лишь поменять кодировку файла и сейчас мы узнаем, как это сделать.

В данном примере будет использоваться Microsoft Word 2010 но принцип решения нашей задачи будет таким же и во всех остальных версиях программы. Итак, открываем наш «проблемный» документ, переходим в меню Файл и нажимаем на пункте Параметры .

Нажимаем Ок и закрываем наш документ. Затем снова открываем его и перед нами должно появится окошко Преобразование файла , в нем нам нужно выбрать пункт Кодированный текст .

После этого появится другое окно, в котором нам нужно будет выбрать кодировку для своего файла. Ставим галочку на пункте Другая и в поле выбора пробуем методом перебора различные кодировки, до тех пор пока не получим результат. В окне Результат вы можете увидеть, как меняется текст в зависимости от выбранной вами кодировки.

Если вышеописанный метод не помог исправить проблему, то возможно она кроется не в неправильной кодировке, а в отсутствии на вашем компьютере шрифта, с использованием которого создавался данный документ. В таком случае вам придется уточнить у отправителя документа название шрифта и установить нужный шрифт на свой компьютер.

Остались вопросы? - Мы БЕСПЛАТНО ответим на них в

Фишка кодировки текстовых фалов в том, что хранятся не сами буквы (символы), а ссылки на них в таблице кодировок. Если с латинским буквами, арабскими цифрами и основными символами типа точек, тире и запятых никаких проблем не возникает: во многих таблицах кодировок все эти буквы, цифры и символы находятся в одних и тех же ячейках, то с кириллицей всё сложно. Например, в разных кодировках буква Ы может находиться в ячейке 211, 114 и 69.

Именно поэтому на заре интернета чтобы посмотреть разные сайты с разными кодировками приходилось подбирать кодировку. (Но кто это помнит? ) Сейчас кодировка страницы обычно прописана в заголовке страницы, что позволяет браузеру "автоматически" подбирать отображение символов на наших мониторах.

То есть сервер отдаёт не просто HTML-страничку, а указывает, что у неё кодировка Windows-1251 . Браузер таким образом, считывая информацию о кодировке полученного файла, подставляет символы из указанной кодировки.

Но и это ещё не всё веселье. Например, если на сервере установлена операционная система из семейства *nix (с кодировкой по умолчанию UTF-8), а мы шлём файл из нашей любимой ОС Windows, где кодировка текстовых фалов по умолчанию стоит почему-то ANSI , то как вы думаете сервер будет работать с текстом, кодировка которой не совпадает с его? Правильно! Как-то будет работать! Но результат работы может быть непредсказуемым и удивительным. =)

Надеюсь, что мотивация для обращение необходимого внимания на кодировку достаточная и можно перейти к сути вопроса: "Как же, чёрт возьми, сохранить файл в нужной кодировке?!"

В этой статье речь пойдёт как раз о том, как сохранить текстовый файл с помощью программы Блокнот (Notepad) в Windows в нужной кодировке.

Для того, чтобы изменить кодировку текстового файла, конечно же сперва его нужно создать . А после того, как файл создан, нужно ещё суметь его открыть. Самый простой способ отрыть файл - это двойной клик левой кнопкой мыши по его иконке в проводнике:

Если до этого настройки Windows не менялись, то файлы с расширением.txt открываются в Блокноте. (Это ещё один способ, как отрыть Блокнот (Notepad) .)

Чтобы поменять кодировку в открывшемся файле, нужно в меню «Файл » текстового редактора Блокнот выбрать пункт «Сохранить как... »:

Откроется диалоговое окно сохранения файла. Для смены кодировки, нужно выбрать из списка предлагаемых необходимый:

После того, как нужная кодировка выбрана, можно кликнуть на кнопку «Сохранить » или просто нажать Enter:

Так как мы не изменили имя файла, то будет перезаписан тот же самый файл. Поэтому возникает справедливый вопрос: «» Ну да, мы к этому и стремимся! Поменять кодировку у этого файла. Поэтому его нужно перезаписать с новой кодировкой. Соглашаемся:

Всё! Миссия по смене кодировки в текстовом файле выполнена! Файл сохранён с новой кодировкой. Можно закрыть текстовый редактор и устроить празднование этого решающего события! =D

ВКонтакте Facebook Одноклассники

С переходом ко все новым версиям Windows острота проблемы существования множества кодировок русского языка почти сошла на нет

Радикально данную проблему призван решить переход к Unicode, который для Windows длится уже не первое поколение этой системы, но все никак не закончится. И, как это часто бывает, решая одни проблемы, Unicode порождает множество других.

Впрочем, для интернет-ресурсов и писем это почти всегда легко решается браузерами и почтовыми клиентами автоматически. Если у вас веб-страница или письмо все же отображается «кракозябрами» (что иногда случается из-за несоблюдения разработчиками стандартов), то нужно из главного меню выбрать пункт «Кодировка» и там методом проб и ошибок установить нужную. Этот пункт в большинстве браузеров находится в меню «Вид» (напомним, что отсутствующее на виду в современных версиях веб-обозревателей главное меню всегда можно вызвать клавишей).

Проблемы «обычного текста»
Одна из таких проблем связана с файлами в формате «обычный текст», хотя, казалось бы, что может быть проще? Бери последовательность текстовых символов и записывай в файл. Но именно из-за этой простоты, если уж проблема в них возникает, то по полной программе.
Если вы попробуете сохранить русский текст через Word (любой версии после Office 97, включая последнюю 2010) как «обычный текст», то получите на выбор ряд однобайтовых русских кодировок. По умолчанию (рис.1) предлагается стандартная «кириллица Windows» (также известная как 1251, или ANSI), знакомая еще по DOS.

Попробуйте сделать то же самое через стандартный «Блокнот» из Windows 7 — вам уже предложат выбор между привычной ANSI и аж тремя вариантами Unicode (рис. 2). Тут уже кроется засада: текстовый файл в формате «юникода» должен сопровождаться специальным заголовком BOM (Byte Order Mark), определяющим порядок следования байтов (т. е. какой байт в 2-байтовом символе идет первым — старший или младший). Собственно засада заключается в том, что BOM не является обязательным атрибутом юникод-файла, и, с одной стороны, может отсутствовать в текстах, полученных из внешнего источника (скажем, из-под некоторых Linux-программ), с другой — вызывать сбои в программах, которые этого заголовка «не понимают».

Рецепт тут один: по мере возможности избегать «юникода» в «чистых текстах» и ориентироваться на привычную ANSI. Это позволит избежать большинства проблем, связанных с русскоязычными текстовыми файлами, хотя и ограничит их переносимость в англоязычные или европейские версии ОС.

Другую задачу, связанную с текстовыми файлами, которая обычно ставит в тупик неопытных пользователей, умеет решать любой Microsoft Word, начиная с версии Office XP — это столкновение с текстами в нестандартной однобайтовой кодировке (например, старинной DOS, также известной как OEM, или 866). Сначала надо убедиться в настройках, что включена опция «Подтверждать преобразование формата файла при открытии» (по умолчанию она выключена!). В старых версиях Word эта настройка находится в меню «Сервис/Параметры» на вкладке «Общие». В Word 2007 нажмите на кнопку с эмблемой Office, выберите «Параметры Word» в нижней части открывшегося окна. В Word 2010 раздел «Параметры» доступен через меню «Файл». В «Параметрах» перейдите к пункту «Дополнительно» на боковой панели, а затем найдите там раздел «Общие» (рис. 3).

При включенной этой функции открывать «нечитаемый» текстовый файл следует через меню «Открыть» (а не щелчком из Проводника, при котором запустится, скорее всего, «Блокнот»). Потом следует выбрать из выпадающего списка типов файлов пункт «Восстановление текста из любого файла». Файл может быть, естественно, любого формата (т. е. необязательно с расширением TXT), лишь бы он содержал текст, а не двоичные символы.

Кстати, просто прочесть документ именно в DOS-кодировке можно и с помощью «Блокнота» и вообще любой программы, которая умеет менять шрифты — достаточно через меню выбора шрифта (в «Блокноте» это «Формат/Шрифт») заменить текущий на Terminal. Не забудьте только вернуть потом шрифт обратно, а то не прочтете нормальные документы.

Unicode в Буфере обмена
Однако такие конфликты с текстовыми файлами — довольно редкий случай. У рядового пользователя гораздо чаще возникают проблемы с Unicode в Буфере обмена. Обычная ситуация, когда при переносе текста из старых программ, не поддерживающих указанную кодировку, или некоторых PDF-документов вместо русского при вставке возникает что-нибудь вроде Auaia iayedai . В большинстве правильно составленных приложений помогает простое переключение на русский язык (именно в той программе, откуда производится копирование, а не в пункте назначения), но нередко встречаются особо упертые приложения и PDF-документы, откуда сведения о том, что это русский язык, не удается извлечь никакими силами.

Microsoft Word в старых версиях Office XP и 2003 умеет решать эту проблему, о чем многие не знают, — в нем есть функция «Исправить поврежденный текст» (в меню «Сервис»). В новых версиях 2007/2010 такой функции нет. В справке и на сайте Microsoft ничего об этом разыскать не удалось — вполне вероятно, в Microsoft посчитали, что продуктов, имеющих подобные свойства, уже не осталось в природе, что, к сожалению, не соответствует действительности.

Возможно, вам тоже не захочется терять время на поиски официального решения. Тогда воспользуйтесь моей программой ClipWin (рис. 4), которую можно скачать по адресу: revich.lib.ru/clipwin.zip. Интерфейс этой программы сделан в расчете на максимально быстрое выполнение операции, но без потери контроля за ее выполнением: если текст в системном «кармане» уже имеется — достаточно запустить программу и трижды нажать на. После первого нажатия текст (уже исправленный) вставится из Буфера обмена в окно для контроля, после второго — исправленный текст заменит тот, что был изначально, а после третьего у вас программа закроется, но сам текст будет исправлен и его можно будет вставлять куда угодно.

Раскладка клавиатуры как правильно?
По моему глубокому убеждению, комфортно существовать и эффективно работать в среде Windows без использования дополнительных переключателей раскладки клавиатуры абсолютно невозможно — необходимость постоянного прицеливания скрюченными пальцами в две клавиши одновременно у меня вызывает боль в пальцах при одной только мысли об этом. Точнее, абсолютно невозможно это было до появления Vista, где вместе с традиционными комбинациям клавиш появилась, наконец, возможность переключать язык ввода одной клавишей <Ё>. Но и такое решение, по крайней мере, для радетелей чистоты русского языка, неприемлемо — не вводить же букву Ё каждый раз через специальную вставку или таблицу символов.

Решение этой проблемы общеизвестно и заключается оно в применении популярной переключалки Punto Switcher, позволяющей настроить для выполнения операции в принципе любую клавишу (обычно это правый или). Программа поддерживается «Яндексом», скачать ее можно из раздела «Программы» поисковика (по адресу soft.yandex.ru) или напрямую по адресу punto.yandex.ru. Об этой и других аналогичных программах недавно рассказал Александр Евдокимов в статье «Корректоры букв».

Многие программы данного типа способны выполнять и другую востребованную функцию: переключение уже набранного в неправильной раскладке текста. В зависимости от настроек, это может осуществляться даже автоматически, хотя лично я предпочитаю эту автоматику отключать.

Еще одно недоразумение, связанное с языковой раскладкой, встречается реже, но может добавить несколько неприятных моментов. После переключения на английский вас может озадачить одна особенность ввода некоторых символов. Это касается таких знаков, как кавычки, апострофы (их два — прямой и наклонный), тильда «~» и циркумфлекс («крышечка») «^». После нажатия соответствующей клавиши ничего не вводится — надо еще нажать либо пробел, чтобы ввести знак в «чистом» виде, либо еще какую-то букву или цифру, тогда знак введется перед ней. Можно нажать кавычку или апостроф дважды — появится сразу пара знаков (они и употребляются часто парами, текст тогда вводится между ними).

Такая, не всегда удобная особенность англоязычного компьютерного ввода может возникнуть, если по каким-то причинам для английского языка установлена раскладка «США-международная» (или, возможно, какая-то из европейских, которые у нас не в ходу). Недоразумение легко устраняется, если сменить раскладку для английского языка обратно на положенную по умолчанию просто «США». В Windows 7 к этой настройке можно добраться в Панели управления через «Языки и региональные стандарты / Языки и клавиатуры / Изменить клавиатуру / Общие / Добавить» (рис. 5).

Итоговый совет
Если у вас возникают другие проблемы с кодировками, не описанные в этой статье, то, вероятнее всего, они вызваны установкой «не той» версии Windows — например, американской или европейской с дополнительным языковым пакетом. Во избежание таких проблем следует по возможности всегда пользоваться русской версией. Но так уж сложилась жизнь у русскоязычных пользователей Windows, что проблема кодировок была, есть и будет. Ее острота снижается по мере обновления программного обеспечения, но, вероятно, проблема никогда не исчезнет полностью.