Представление данных
Представление данных
Протокол FTP предоставляет различные способы управления передачей и хранения файлов. Необходимо сделать выбор по четырем пунктам.
- Тип файла.
(а)
ASCII файлы.
(По умолчанию) Текстовый файл передается по соединению данных как NVT ASCII. При этом требуется, чтобы отправитель конвертировал локальный текстовый файл в NVT ASCII, а получатель конвертировал NVT ASCII в текстовый файл. Конец каждой строки передается в виде NVT ASCII символа возврата каретки, после чего следует перевод строки. Это означает, что получатель должен просматривать каждый байт в поисках пары символов CR, LF. (Мы видели тот же сценарий в случае передачи ASCII файла с помощью TFTP в разделе
"Протокол" главы 15.)
(b)
EBCDIC файлы.
Альтернативный способ передачи текстовых файлов, когда на обоих концах системы EBCDIC.
(c)
Двоичные или бинарные файлы. (Image.)
Данные передаются как непрерывный поток битов.
(d)
Локальный тип файлов.
Способ передачи бинарных файлов между хостами, которые имеют различный размер байта. Количество битов в байте определяется отправителем. Для систем, которые используют 8-битные байты, локальный тип файла с размером байта равным 8 эквивалентен бинарному типу файла.
Управление форматом. Применяется только для ASCII и EBCDIC файлов.
(a)
Nonprint. (По умолчанию)
Файл не содержит информацию вертикального формата.
(b)
Telnet format control.
Файл содержит управляющие символы вертикального формата Telnet, которые интерпретируются принтером.
(c)
Fortran carriage control.
Первый символ каждой строки это Fortran символ управления формата.
Структура.
(a)
Структура файла.
(По умолчанию) Файл воспринимается в виде непрерывного потока байтов. Файл не имеет внутренней структуры.
(b)
Структура записи.
Эта структура используется только в случае текстовых файлов (ASCII или EBCDIC).
(c)
Структура страницы.
Каждая страница передается с номером страницы, что позволяет получателю хранить страницы в случайном порядке. Предоставляется операционной системой TOPS-20. (Требование к хостам Host Requirements RFC не рекомендует использовать эту структуру.)
Режим передачи. Указывает на то, как файл передается по соединению данных.
(a)
Режим потока.
(По умолчанию) Файл передается как поток байтов. Для файловой структуры конец файла указывает на то, что отправитель закрывает соединение данных. Для структуры записи специальная 2-байтовая последовательность обозначает конец записи и конец файла.
(b)
Режим блоков.
Файл передается как последовательность блоков, перед каждым из них стоит один или несколько байт заголовков.
(c)
Сжатый режим.
Простое кодирование неоднократно встречающихся повторяющихся байт. В текстовых файлах обычно сжимаются пустые строки или строки из пробелов, а в бинарных строки из нулевых байт. (Этот режим поддерживается редко. Существуют более оптимальные способы сжатия файлов для FTP.)
Если посчитать количество комбинаций из приведенных вариантов, то получится 72 способа передачи и хранения файла. К счастью, можно игнорировать многие из этих опций, потому что они не поддерживаются в большинстве реализаций.
Самые распространенные Unix реализации FTP клиента и сервера предоставляют следующий выбор:
- Тип: ASCII или двоичный.
- Управление форматом: только nonprint.
- Структура: только файловая структура.
- Режим передачи: только потоковый режим.
Это ограничивает нас одним из двух режимов: ASCII или двоичный.
Подобная реализация отвечает минимальным требованиям к хостам Host Requirements RFC. (RFC также требует обеспечить поддержку для структуры записи, однако только если операционная система поддерживает это, а Unix, как правило, не поддерживает.)
Большинство не-Unix реализаций предоставляет FTP возможности, которые позволяют обрабатывать их собственные форматы файлов. Требование к хостам Host Requirements RFC говорит: "Протокол FTP включает множество характеристик, некоторые из которых распространены не очень широко. Однако, для каждой характеристики в FTP существует по меньшей мере одна реализация."
Содержание раздела