Minor FR: BOM

Обсуждение вопросов, связанных с системой проведения турниров ejudge.
Post Reply
vk
Posts:165
Joined:24 August 2007, 13:44
Location:Ханты-Мансийск
Contact:
Minor FR: BOM

Post by vk » 22 November 2011, 06:17

Здравствуйте!

Можно ли сделать так, чтобы при проверке турниров помимо конвертации \r\n в \n также происходило удаление BOM, если она есть?

cher
Posts:1153
Joined:13 March 2004, 17:00
Contact:

Re: Minor FR: BOM

Post by cher » 22 November 2011, 09:14

BOM в какой кодировке?

vk
Posts:165
Joined:24 August 2007, 13:44
Location:Ханты-Мансийск
Contact:

Re: Minor FR: BOM

Post by vk » 22 November 2011, 18:49

UTF8

cher
Posts:1153
Joined:13 March 2004, 17:00
Contact:

Re: Minor FR: BOM

Post by cher » 22 November 2011, 19:22

такое бывает?

я и в visual studio, и в других редакторах редактировал текст в utf8. вроде все редакторы сохраняют файлы без bom.

проблема здесь в том, что чтобы удалять бом нужно быть уверенным, что входные данные в утф8...

vk
Posts:165
Joined:24 August 2007, 13:44
Location:Ханты-Мансийск
Contact:

Re: Minor FR: BOM

Post by vk » 22 November 2011, 21:52

Бывает, и довольно часто. Например, мой любимый редактор Notepad++ по-умолчанию UTF8 сохраняет с BOM.

Я то еще за этим слежу, но если задания прислали со стороны, то приходится каждый тест проверять, не сохранен ли он в UTF-8 с BOM. Иногда пропускаю и все решения получают WA.

Сомневаюсь, что не-юникодовские файлы будут содержать такую сигнатуру в начале файла. Хотя конечно теоретически такое возможно...

cher
Posts:1153
Joined:13 March 2004, 17:00
Contact:

Re: Minor FR: BOM

Post by cher » 23 November 2011, 09:08

Хм. Пользуюсь notepad++, но никогда с этим не сталкивался.

Я бы не делал удаление BOM для всех сабмитов по умолчанию, но можно добавить такую опцию.

Еще можно отказаться от поля выбора файла для сдачи и заменить его на текстовое поле ввода ответа. Тогда проблемы с кодировками уйдут сами собой.

Post Reply