Выбор кодировки текста при открытии и сохранении файлов
Как правило, при совместной работе с текстовыми файлами нет необходимости вникать в технические аспекты хранения текста. Однако если необходимо поделиться файлом с человеком, который работает с текстами на других языках, просмотреть текстовый файл из Интернета или открыть его на компьютере с другой операционной системой, может потребоваться задать кодировку при его открытии или сохранении.
Когда вы открываете текстовый файл в Microsoft Word или другой программе (например, на компьютере, язык операционной системы на котором отличается от того, на котором написан текст в файле), кодировка помогает программе определить, в каком виде нужно вывести текст на экран, чтобы его можно было прочитать.
В этой статье
Общие сведения о кодировке текста
Текст, который отображается в виде текста на экране, на самом деле сохраняется как числовые значения в текстовом файле. Компьютер переводит числовые значения в видимые символы. Для этого используется стандарт кодировки.
Кодировка — это схема нумерации, согласно которой каждому текстовому символу в наборе соответствует определенное числовое значение. Кодировка может содержать буквы, цифры и другие символы. В различных языках часто используются разные наборы символов, поэтому многие из существующих кодировок предназначены для отображения наборов символов соответствующих языков.
Различные кодировки для разных алфавитов
Сведения о кодировке, сохраняемые с текстовым файлом, используются компьютером для вывода текста на экран. Например, в кодировке «Кириллица (Windows)» знаку «Й» соответствует числовое значение 201. Когда вы открываете файл, содержащий этот знак, на компьютере, на котором используется кодировка «Кириллица (Windows)», компьютер считывает число 201 и выводит на экран знак «Й».
Однако если тот же файл открыть на компьютере, на котором по умолчанию используется другая кодировка, на экран будет выведен знак, соответствующий числу 201 в этой кодировке. Например, если на компьютере используется кодировка «Западноевропейская (Windows)», знак «Й» из исходного текстового файла на основе кириллицы будет отображен как «É», поскольку именно этому знаку соответствует число 201 в данной кодировке.
Юникод: единая кодировка для разных алфавитов
Чтобы избежать проблем с кодированием и декодированием текстовых файлов, можно сохранять их в Юникоде. В состав этой кодировки входит большинство знаков из всех языков, которые обычно используются на современных компьютерах.
Так как Word работает на базе Юникода, все файлы в нем автоматически сохраняются в этой кодировке. Файлы в Юникоде можно открывать на любом компьютере с операционной системой на английском языке независимо от языка текста. Кроме того, на таком компьютере можно сохранять в Юникоде файлы, содержащие знаки, которых нет в западноевропейских алфавитах (например, греческие, кириллические, арабские или японские).
Выбор кодировки при открытии файла
Если в открытом файле текст искажен или выводится в виде вопросительных знаков либо квадратиков, возможно, Word неправильно определил кодировку. Вы можете указать кодировку, которую следует использовать для отображения (декодирования) текста.
Откройте вкладку Файл.
Нажмите кнопку Параметры.
Нажмите кнопку Дополнительно.
Перейдите к разделу Общие и установите флажок Подтверждать преобразование формата файла при открытии.
Примечание: Если установлен этот флажок, Word отображает диалоговое окно Преобразование файла при каждом открытии файла в формате, отличном от формата Word (то есть файла, который не имеет расширения DOC, DOT, DOCX, DOCM, DOTX или DOTM). Если вы часто работаете с такими файлами, но вам обычно не требуется выбирать кодировку, не забудьте отключить этот параметр, чтобы это диалоговое окно не выводилось.
Закройте, а затем снова откройте файл.
В диалоговом окне Преобразование файла выберите пункт Кодированный текст.
В диалоговом окне Преобразование файла установите переключатель Другая и выберите нужную кодировку из списка.
В области Образец можно просмотреть текст и проверить, правильно ли он отображается в выбранной кодировке.
Если почти весь текст выглядит одинаково (например, в виде квадратов или точек), возможно, на компьютере не установлен нужный шрифт. В таком случае можно установить дополнительные шрифты.
Чтобы установить дополнительные шрифты, сделайте следующее:
Нажмите кнопку Пуск и выберите пункт Панель управления.
Выполните одно из указанных ниже действий.
На панели управления выберите элемент Удаление программ.
В списке программ щелкните Microsoft Office или Microsoft Word, если он был установлен отдельно от пакета Microsoft Office, и нажмите кнопку Изменить.
В Windows Vista
На панели управления выберите раздел Удаление программы.
В списке программ щелкните Microsoft Office или Microsoft Word, если он был установлен отдельно от пакета Microsoft Office, и нажмите кнопку Изменить.
На панели управления щелкните элемент Установка и удаление программ.
В списке Установленные программы щелкните Microsoft Office или Microsoft Word, если он был установлен отдельно от пакета Microsoft Office, и нажмите кнопку Изменить.
В группе Изменение установки Microsoft Office нажмите кнопку Добавить или удалить компоненты и затем нажмите кнопку Продолжить.
В разделе Параметры установки разверните элемент Общие средства Office, а затем — Многоязыковая поддержка.
Выберите нужный шрифт, щелкните стрелку рядом с ним и выберите пункт Запускать с моего компьютера.
Совет: При открытии текстового файла в той или иной кодировке в Word используются шрифты, определенные в диалоговом окне Параметры веб-документа. (Чтобы вызвать диалоговое окно Параметры веб-документа, нажмите кнопку Microsoft Office, затем щелкните Параметры Word и выберите категорию Дополнительно. В разделе Общие нажмите кнопку Параметры веб-документа.) С помощью параметров на вкладке Шрифты диалогового окна Параметры веб-документа можно настроить шрифт для каждой кодировки.
Выбор кодировки при сохранении файла
Если не выбрать кодировку при сохранении файла, будет использоваться Юникод. Как правило, рекомендуется применять Юникод, так как он поддерживает большинство символов большинства языков.
Если документ планируется открывать в программе, которая не поддерживает Юникод, вы можете выбрать нужную кодировку. Например, в операционной системе на английском языке можно создать документ на китайском (традиционное письмо) с использованием Юникода. Однако если такой документ будет открываться в программе, которая поддерживает китайский язык, но не поддерживает Юникод, файл можно сохранить в кодировке «Китайская традиционная (Big5)». В результате текст будет отображаться правильно при открытии документа в программе, поддерживающей китайский язык (традиционное письмо).
Примечание: Так как Юникод — это наиболее полный стандарт, при сохранении текста в других кодировках некоторые знаки могут не отображаться. Предположим, например, что документ в Юникоде содержит текст на иврите и языке с кириллицей. Если сохранить файл в кодировке «Кириллица (Windows)», текст на иврите не отобразится, а если сохранить его в кодировке «Иврит (Windows)», то не будет отображаться кириллический текст.
Если выбрать стандарт кодировки, который не поддерживает некоторые символы в файле, Word пометит их красным. Вы можете просмотреть текст в выбранной кодировке перед сохранением файла.
При сохранении файла в виде кодированного текста из него удаляется текст, для которого выбран шрифт Symbol, а также коды полей.
Выбор кодировки
Откройте вкладку Файл.
Выберите пункт Сохранить как.
Чтобы сохранить файл в другой папке, найдите и откройте ее.
В поле Имя файла введите имя нового файла.
В поле Тип файла выберите Обычный текст.
Нажмите кнопку Сохранить.
Если появится диалоговое окно Microsoft Office Word — проверка совместимости, нажмите кнопку Продолжить.
В диалоговом окне Преобразование файла выберите подходящую кодировку.
Чтобы использовать стандартную кодировку, выберите параметр Windows (по умолчанию).
Чтобы использовать кодировку MS-DOS, выберите параметр MS-DOS.
Чтобы задать другую кодировку, установите переключатель Другая и выберите нужный пункт в списке. В области Образец можно просмотреть текст и проверить, правильно ли он отображается в выбранной кодировке.
Примечание: Чтобы увеличить область отображения документа, можно изменить размер диалогового окна Преобразование файла.
Если появилось сообщение «Текст, выделенный красным, невозможно правильно сохранить в выбранной кодировке», можно выбрать другую кодировку или установить флажок Разрешить подстановку знаков.
Если разрешена подстановка знаков, знаки, которые невозможно отобразить, будут заменены ближайшими эквивалентными символами в выбранной кодировке. Например, многоточие заменяется тремя точками, а угловые кавычки — прямыми.
Если в выбранной кодировке нет эквивалентных знаков для символов, выделенных красным цветом, они будут сохранены как внеконтекстные (например, в виде вопросительных знаков).
Если документ будет открываться в программе, в которой текст не переносится с одной строки на другую, вы можете включить в нем жесткие разрывы строк. Для этого установите флажок Вставлять разрывы строк и укажите нужное обозначение разрыва (возврат каретки (CR), перевод строки (LF) или оба значения) в поле Завершать строки.
Поиск кодировок, доступных в Word
Word распознает несколько кодировок и поддерживает кодировки, которые входят в состав системного программного обеспечения.
Ниже приведен список письменностей и связанных с ними кодировок (кодовых страниц).
Юникод (UCS-2 с прямым и обратным порядком байтов, UTF-8, UTF-7)
Стандартный шрифт для стиля «Обычный» локализованной версии Word
Windows 1256, ASMO 708
Китайская (упрощенное письмо)
GB2312, GBK, EUC-CN, ISO-2022-CN, HZ
Китайская (традиционное письмо)
BIG5, EUC-TW, ISO-2022-TW
Windows 1251, KOI8-R, KOI8-RU, ISO8859-5, DOS 866
Английская, западноевропейская и другие, основанные на латинице
Как открыть зашифрованный Word файл
Можно ли обойти парольную защиту в документах Microsoft Word? Зависит ли это от версии Word? Когда при этом можно сэкономить время и деньги?
Ответы в этой заметке.
Парольная защита в Microsoft Word
В Word реализовано несколько вариантов парольной защиты информации:
- Защита открытия документа
- Защита изменения документа
- Защита рабочей книги
- Защита VBA макросов
Все они, кроме «Пароля на открытие», не шифруют данные, а только ограничивают доступ к ним. Данные при этом можно просмотреть, распечатать, обработать макросами, но их нельзя изменить. Зато такие «ограничительные» пароли можно мгновенно найти, заменить или удалить для всех версий Word.
Рис. 1: Программы для восстановления Word паролей мгновенно находят пароли простой защиты
«Пароль на открытие» — совсем другое дело.
Из этого пароля специальные алгоритмы (алгоритмы хэширования) вычисляют ключ шифрования, которым другие алгоритмы (алгоритмы шифрования) шифруют все данные doc/docx-файла. Не зная пароль (или – ой, спойлер – ключ ;)), из зашифрованного Word файла невозможно прочитать никакие данные.
И как быть, если «Пароль на открытие» потерян? Ответ зависит от формата Microsoft Office, в котором был сохранён документ.
Удаление Пароля открытия из файла Microsoft Word
Существуют три, принципиальных по возможностям удаления пароля, деления версий формата:
- Microsoft Word 6/95 – пароль открытия всегда находится мгновенно
- Microsoft Word 97-2003 (40bit) – пароль искать не целесообразно, проще найти ключ шифрования и расшифровать документ не зная пароля
- Microsoft Word 2007-2016 – пароль открытия ищется только методом перебора, а его скорость можно увеличить за счёт GPU-ускорения на видеокартах AMD/NVIDIA
Пароль на открытие Word 6-95
Это устаревший формат, который встречается всё реже. Для защиты данных в нём применялась примитивная защита, пароль для которой всегда восстанавливается мгновенно, а успех не зависит ни от длины, ни от сложности самого пароля.
Рис. 1: Для взлома Пароля на открытие Word 6-95 достаточно паролеломалки начального уровня
Пароль на открытие Word 97-2003 (40-bit)
Пожалуй, наиболее распространённый на сегодня формат со своими недостатками в защите данных.
Для шифрования в нём используется очень короткий ключ. Это позволяет искать не пароль, а этот самый ключ и гарантирует 100%-ый успех в расшифровке данных. Ведь количество вариантов ключа не меняется вне зависимости от сложности и длины оригинального пароля — оно всегда равно 2 40 (40 бит, вы помните, да?), а сколько при этом придётся проверить паролей не известно…
Количество вариантов для проверки считается по формуле: число символов в степени длины пароля. То есть (для английского алфавита) это по 26 строчных и заглавных букв, 10 цифр, [допустим] 8 спецсимволов — в сумме 70 символов. И тогда для 7-ми символьного пароля вариантов будет уже в семь раз больше, чем вариантов ключа шифрования: 70 7 = 8235430000000 / 2 40 = 1099511627776
И это без гарантии успеха. А что если длина пароля, скажем, 9 символов.
Вся эта история с лёгкостью и 100% гарантией успеха расшифровки 40-ка битных Word 97-2003 (к слову и Excel тоже!) не была бы полной, без упоминания радужных таблиц.
Радужные таблицы содержат заранее просчитанные цепочки ключей шифрования, что в разы сокращает поиск нужного ключа практически без снижения процента успеха. На основе радужных таблиц существуют и онлайн-сервисы для открытия зашифрованных Word файлов.
Рис.4: Радужные таблицы Пасковери в работе на ВерниДоступ.ру
Пароль на открытие Word 2007-2016
Формат набирает популярность и вместе с этим заканчивается время быстрой расшифровки Word файлов. Пароли приходится восстанавливать, то есть попросту перебирать варианты один за другим в надежде, что нужный пароль попадётся в их числе за разумное время.
Помимо увеличения длины ключа шифрования (например, в Word 2013 он уже 256 бит и такой ключ найти нереально), разработчики усложняют и алгоритмы хэширования, замедляя время формирования ключа. При вводе правильного пароля это не заметно, но при переборе миллионов вариантов, падение скорости от версии к версии формата только растёт. Даже в высоко-оптимизированных программах. Даже с GPU ускорением на видеокартах.
Условия успешного поиска «Пароля на открытие» для Word 2007-2016:
- манипулирование диапазоном проверки. Умение отсечь лишние проверки позволяет здорово сэкономить время при переборе вариантов. Для манипулирования используют атаку с мутациями по словарям, атаку по простой и позиционной маске. Мутация словарей помогает охватить варианты намеренного изменения пароля из обычного слова, а позиционная маска задать возможные значения для каждой позиции в пароле
- GPU ускорение на видеокартах NVIDIA/AMD. Задача поиска пароля отлично масштабируется и способна выполнятся на современных видеокартах. Чем более производительные видеокарты подключаются к поиску, тем выше скорость поиска и тем быстрее может быть достигнут успех
- программы для восстановления паролей, заточенные на скорость поиска. Оптимизация в таких программах способна увеличивать скорость перебора вариантов в десятки раз. Поэтому уделяйте особое внимание оценке возможностей программы-паролеломалки по скорости перебора паролей
Квинтэссенция
Итак, как открыть зашифрованный Microsoft Word файл:
Как снять защиту от редактирования с документа в Word
Подскажите, с одним вопросом. Я купил новый ПК и перенес все свои документы на него. Все было нормально какое-то время, но потом я обнаружил, что часть документов Word недоступна для редактирования.
Как теперь мне можно снять защиту от редактирования этих «вордовских» документов, если доступа к старому компьютеру у меня нет? Совсем не хочется вручную переписывать десятки страниц.
То, что документы целы и они открываются — уже очень неплохо! Обычно, защищают от редактирования для того, чтобы случайно не удалить нужные данные из документа (особенно, если его используют на локальных ресурсах). Возможно, на вашем старом ПК Word автоматически был как-то настроен, что включал защиту «по умолчанию».
Как бы там ни было, в этой статье приведу несколько вариантов решения подобной проблемы. Думаю, один из них решит вашу задачу .
Что можно предпринять с документом, для которого нет разрешения
Создать новый документ и сделать копию текста из защищенного документа
- запускаем Word (если уже открыть — нажмите Ctrl+N, т.е. создать новый документ);
- далее откройте раздел «Вставка» и нажмите по меню «Объект/Текст из файла» (см. скрин ниже);
Вставка — текст из файла
Кстати, возможно, что у вас будет отображено немного отличное меню: «Вставка/Текст/Объект/текст из файла» (см. скрин ниже).
Вставка — текст — объект — текст из файла (кликабельно!)
Попробовать «занулить» пароль, защищающий редактирование
Если первый способ вам не подошел по каким-либо причинам, можно попробовать альтернативный вариант. Правда, при его реализации может пострадать разметка документа (но это же получше, чем вручную его заново набивать?).
- Сначала необходимо просто открыть документ Word;
- Далее сохраните документ как «Веб-страницу». Закройте Word;
Выбор формата документа при сохранении
Рецензирование — Защитить — Ограничить редактирование
Заново «перегнать» документ в скрины, а затем в текст с помощью Fine Reader
Этот способ самый «муторный» с одной стороны, с другой — позволяет решить подобные проблемы даже в самых сложных случаях, когда все остальное бессильно.
- открываем документ для просмотра в любой программе (лишь бы открылся и на экране вы увидели текст).
- делаем скриншоты нужных страничек (всего того, что отображено на экране). Для удобства и быстроты можно использовать спец. скриншотеры, которые по одной кнопке могут сразу же автоматически сохранять скрин в выбранный вами каталог;
- после, запускаете программу Fine Reader, открываете в ней сделанные скриншоты с экрана и переводите их в текст. В общем-то, работа с программой достаточно простая — нужно-то выделить текстовые блоки и нажать по кнопке «Распознать».
Как снять защиту с документа Word
Если Вы скачали документ в формате MS Word из Интернета, или Вам дали какой-нибудь план на работе, в институте или школе, тогда высока вероятность того, что возможность редактировать данный документ будет ограничена.
Что это значит? Это значит, что документ был защищен от редактирования и копирования тем человеком, который открывал его в последний раз. Соответственно, Вы не сможете ничего поменять в тексте или скопировать нужный фрагмент. А при попытке, справа откроется область, как показано на скриншоте ниже. Внизу данной области будет кнопка «Отключить защиту», но кликнув по ней, появится окно для ввода пароля, который был установлен при ограничении редактирования.
Учитывая, что пароля мы не знаем, давайте рассмотрим, как можно отключить защиту от редактирования и копирования текста в Ворде, чтобы у Вас снова появилась возможность вносить нужные изменения в тексте.
Снятие защиты от копирования и редактирования текста
Убрать защиту можно, изменив расширение самого документа с *.docx на *.zip и немного подкорректировав один файл из созданного архива. Используя данный способ, получится снять защиту от редактирования текста, в какой бы версии документ не был создан: в Word 2007, 2010, 2013 или 2016.
Перед тем, как начать работу с самим заблокированным файлом, нужно сделать так, чтобы в Проводнике показывались их расширения. Для этого откройте Проводник Windows (зайдите в любую папку или нажмите на «Мой компьютер» ), нажмите по кнопке «Упорядочить» и выберите из списка «Параметры папок и поиска» . Это в операционной системе Windows 7.
Если у Вас установлена ОС Windows 10, тогда откройте Проводник и перейдите на вкладку «Вид» . Справа вверху будет кнопка «Параметры» , нажмите на нее и выберите «Изменить параметры папок и поиска» .
После этого, откроется вот такое окно. В нем перейдите на вкладку «Вид» . В разделе «Дополнительные параметры» нужно найти пункт «Скрывать расширения для зарегистрированных типов файлов» и убрать напротив него галочку. Затем нажмите «Применить» и «ОК» .
Теперь у нас возле названия нужного нам документа, редактирование которого заблокировано, показано и его расширение.
Выделите его, кликнув по нему один раз мышкой. Затем кликните мышкой по названию самого файла. Когда появится поле для редактирования названия, удалите расширение *.docx и вместо него введите *.zip . В примере, файл назывался «Ворд.docx», а стал «Ворд.zip». Как видите, название мы не меняем.
Когда появится вот такое окошко, нажмите в нем «Да» .
Заходим в только что созданный архив. В нем будет несколько файлов и папок. Найдите папку «word» и зайдите в нее. В папке Вы увидите «settings.xml» – он нам и нужен. Кликните по нему левой кнопкой мышки, и, не отпуская кнопки, перетащите файл на рабочий стол.
Затем кликните правой кнопкой мышки по «settings.xml» , который Вы поместили на рабочий стол, и выберите из контекстного меню «Открыть с помощью» . Из предложенных программ, можно выбрать обычный «Блокнот» .
Выбранный файл откроется в Блокноте. Теперь нужно найти тег, который касается защиты, и немного его исправить. Чтобы открыть окошко поиска, нажмите Ctrl+F . Затем введите в строку поиска слово «Protection» и нажмите «Найти далее» .
В тексте подсветится данное слово. Как видите, в параметрах – «edit» , указано – «readOnly» , что значит, что данный документ Ворд можно использовать только для чтения. Удалите фрагмент «w:edit=”readOnly”» .
На данном скриншоте показан текст, в котором удалена ненужная строка. После этого нажмите «Файл» – «Сохранить» , чтобы сохранить внесенные в документ изменения.
Дальше нам нужно заменить файл «settings.xml» , который находится в архиве, на тот, который мы только что подкорректировали.
Для этого выделите «settings.xml» на рабочем столе, и, не отпуская левой кнопки мыши, перетащите файлик обратно в архив. Появится диалоговое окно, в котором посмотрите, чтобы в поле «Метод обновления» было выбрано «Добавить с заменой файлов» и нажмите «ОК» .
Снова переименовываем наш документ Word. Только теперь из архива делаем вордовский файл – поменяйте расширение с *.zip на *.docx . В появившемся диалоговом окне нажмите «Да» .
Можете заходить в документ, текст в котором был защищен от редактирования. Как видите, защите в Ворде снята, и Вы можете печатать в документе или скопировать из него нужный текст.
Второй вариант снятия защиты
Давайте рассмотрим еще один способ, который поможет убрать защиту необходимого документа. Он проще предыдущего. Показывать я буду на примере MS Word 2010, данные рекомендации подойдут и для тех, у кого установлен Word 2007 и Word 2013. Если же у Вас стоит MS Word 2016, тогда действия те же, только нужные кнопки могут находиться в других вкладках.
Начать нужно с создания нового документа. Делается это так: «Пуск» – «Все программы» , найдите папку «Microsoft Office» и кликните в ней по пункту «Microsoft Word» .
В новом документе перейдите на вкладку «Вставка» . В разделе «Текст» нажмите на маленькую стрелочку возле кнопки «Объект» . Из списка выберите «Текст из файла» .
Дальше в окне «Вставка файла» откройте папку, в которой сохранен защищенный документ. Выделите его мышкой и нажмите «Вставить» .
После этого весь текст из защищенного документа будет вставлен в новый, открытый Вами, файл. А в нем уже появится возможность изменять текст и копировать его.
Надеюсь, данные рекомендации будут Вам полезны. Убрать защиту с документа, в котором запрещено редактирование и копирование текста, не так уж и сложно, выбирайте один из описанных способов и снова работайте с нужными файлами.