Установка wget из портов для FreeBSD

Установка wget из портов для FreeBSD

Введение в GNU Wget.

GNU Wget является бесплатным пакетом программного обеспечения (ПО) для получения файлов с помощью HTTP, HTTPS и FTP, наиболее широко используемых протоколов Интернет. Это не интерактивный инструмент командной строки, поэтому он может вызывается из сценариев, терминалов без поддержки X-Windows и т. д.

GNU Wget имеет множество функций, можно скачивать файлы (ISO, картинки, музыку, веб страницы и др) и даже целый веб-сайт или FTP-сайт, в том числе:

•             Может возобновить прерванные загрузки, используя REST и RANGE.

•             По желанию преобразует абсолютные ссылки в загруженных документов на родственника, чтобы загруженные документы были связаны друг с другом локально.

•             Работает на большинстве UNIX-подобных операционных систем, а также Microsoft Windows.

•             Поддержка HTTP прокси.

•             Поддержка HTTP cookies (куки).

•             Поддерживает постоянные соединения HTTP.

•             Автоматическая / фоновая операция.

•             GNU Wget распространяется под GNU General Public License.

•             И др его плюсы.

Установка wget  из портов для FreeBSD

Установить можно из пакетов (портов), а можно и собрать (скомпилировать) из исходного кода.  Я буду устанавливать из портов — это быстрый способ что бы установить программу, на компиляцию
потребуется больше времени и документации.

# cd /usr/ports/ftp/wget
# make install clean

или скачать исходный код.

Скачать GNU Wget.

Исходный код для GNU Wget можно найти на

http://ftp.gnu.org/gnu/ [через HTTP] и ftp://ftp.gnu.org/gnu/ [через FTP]

Документация.

Документацию GNU Wget можно найти на http://www.gnu.org/software/wget/manual/. Для руководства о других пакетах GNU посетите  http://www.gnu.org/manual/

Примеры использование программы Wget.

1. Допустим, вы хотите скачать URL. Просто введите:

# wget http://linux-notes.org/

Вы увидите на экране в консоле  что-то вроде:

—13:30:45—http://fly.cc.fer.hr:80/

=>`index.html’

Connecting to fly.cc.fer.hr:80… connected!

HTTP request sent, fetching headers… done.

Length: 1,749 [text/html]

0K -> .

13:30:46 (68.32K/s) — `index.html’ saved [1749/1749]

2. Но что произойдет, если связь медленная, а файл длиннющий? Соединение вероятно отсоединиться и файл не докачаеться. В этом случае Wget будет пытаться получить файл, пока он либо не скачает весь файл, или превысит количество попыток — по умолчанию (20).  Можно легко изменить количество попыток  чтобы гарантировать, что весь файл скачаеться безопасно:

# wget --tries=45 http://fly.cc.fer.hr/jpg/flyweb.jpg

3. Теперь давайте запустим Wget чтобы он работал в фоновом режиме, и записать этот отчет в файл ‘log’, для того чтобы это сделать нужно набрать «—tries», но это утомляет, по этому можно написать более короче — использовать ‘-t’.

# wget -t 45 -o log http://fly.cc.fer.hr/jpg/flyweb.jpg &

Амперсанд в конце строки говорит, что Wget будет работать в фоновом режимеДля снятия ограничения на количество попыток можно воспользоваться «-t inf «

4. Использование FTP так же просто.

# wget ftp://gnjilux.cc.fer.hr/welcome.msg

—23:35:55—  ftp://gnjilux.cc.fer.hr:21/welcome.msg

=> `welcome.msg’

Connecting to gnjilux.cc.fer.hr:21… connected!

Logging in as anonymous … Logged in!

==> TYPE I … done.  ==> CWD not needed.

==> PORT … done.    ==> RETR welcome.msg … done.

Length: 1,340 (unauthoritative)

0K -> .

23:35:56 (37.39K/s) — `welcome.msg’ saved [1340]

5. Если вы укажете каталог, Wget будет получит список каталога, а разложит его и преобразует  в HTML:

# wget ftp://prep.ai.mit.edu/pub/gnu/ lynx index.html

Расширенное использование.

1. Вы хотите прочитать список URL-адресов из файла? Не проблема:

# wget -i file

Если указать `- ‘как имя файла, то URL-адреса будут считываться из стандартного ввода.

2.  Создать зеркальное изображение сайте GNU WWW (с той же структурой каталогов что и  оригинал) только с одной попыткой и сохранить в журнал `gnulog ‘:

# wget-р-T1 http://www.linux-notes.org/-оgnulog

3. Получить первый слой Ссылок в Yahoo:

# wget-р-L1 http://www.linux-notes.org/

4. Извлечь index.html из `www.linux-notes.org», показывая оригинальные серверные заголовки:

# wget-S http://www.linux-notes.org/

5. Сохраните сервера заголовки с файлом:

# wget-х http://www.linux-notes.org/

не только index.html

6. Получить первые два уровня `wuarchive.wustl.edu ‘, сохраняя их в / TMP.

# wget -P/tmp-L2 ftp://linux-notes.org/

7. Вы хотите скачать все GIF-файлы из каталога HTTP. `Wget http://host/dir/ *. gif» не работает, так как поисковый HTTP браузер не поддерживает подстановку. В этом случае используйте:

# wget -r -l1 --no-parent -A.gif http://host/dir/

8. Предположим, что у Вас произошел разрыв в середине загрузки, когда Wget качал файлы и Вы не хотите замещать файлы которые уже скачаны (имеющиеся). Используйте это так:

# wget-NC-R http://www.linux-notes.org/

9. Если вы хотите указать имя пользователя и пароль для HTTP или FTP, используйте соответствующий синтаксис URL:

# wget ftp://hniksic:mypassword@jagor.srce.hr/.emacs

10. Если вам не нравится визуализация по умолчанию (1 Кбайт на точку, 10 точек в кластере, 50 точек в строке), вы можете настроить это через настройку точек. Например, многие люди, как «бинарной» стиль представления, с 8K точек и 512K линий:

# wget --dot-style=binary ftp://prep.ai.mit.edu/pub/gnu/README

Вы можете экспериментировать с другими стилями, так:

# wget --dot-style=mega ftp://linux-notes.org/pub/xemacs/xemacs-20.4/xemacs-20.4.tar.gz
# wget --dot-style=micro http://linux-notes.org/

Чисто для ПРО, =D

1. Если вы хотите Wget загружал из зеркала страницы (или FTP каталоги), то используйте `—mirror’ (`-m’) что является сокращением для`-r-N’. Вы можете прописать Wget в файле кронтаба чтобы выполнять проверку сайта каждое воскресенье например (можно настроить выполнение на любое времячисло, месяц, год):

crontab

0 0 * * 0 wget --mirror ftp://ftp.xemacs.org/pub/xemacs/ -o /home/me/weeklog

2. Вы можете скачивать то же самое с чьей-то домашней страницей. Но вы не хотите,  загружать все эти образы или файлы и вас интересует только HTML, тогда:

# wget --mirror -A.html http://www.w3.org/

3. Но как насчет зеркал которые близки к вам сети? DNS поможет в этом вопросе, просто используйте ключ ‘-D’

# wget -rN -Dsrce.hr http://www.srce.hr/

4. Что бы преобразовать абсолютные ссылки в относительные? Используйте `-к ‘:

# wget -k -r URL

5. Вам необходимо чтобы выгружаемые документы выдавались на стандартный вывод вместо записи их в файлы? ОКно Wget автоматически умолкнет (включить «—quiet»), чтобы избежать смешивания вывода Wget и получаемых документов.

# wget -O - http://jagor.srce.hr/ http://www.linux-notes.org/

Вы также можете комбинировать две опции и сделать потоки для получения документов из удаленных хостов:

# wget -O - http://linux-notes.org/ | wget --force-html -i -

Установка wget из портов для FreeBSD завершена. Пользуйтесь)

Мои партнеры:
1. Вздулся аккумулятор на телефоне. Почему вздуваются аккумуляторы. » АККУМУЛЯТОРНЫЕ БАТАРЕЙКИ: зарядка батареек

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.