Скачать все ссылки с любой страницы

Я хочу разработать страницу asp.net, с помощью которой я могу указать URL-адрес любой страницы, содержащей ссылки на множество файлов и каталогов. Я хочу скачать их все. Аналогичен плагину DownThemAll для FireFox.

i.e.

Файл «MyPage.htm» содержит множество ссылок на файлы/каталоги, расположенные на том же сервере.

теперь я хочу написать функцию, которая может загрузить все эти файлы, если я предоставлю

«www.mycustomdomain.com\Mypage.htm» в качестве входных данных.

надеюсь вопрос понятен.

Я предполагаю, что вы рассматриваете только HTTP/HTML? Вы умеете парсить HTML? Взгляните на HTML Agility Pack.   —  person Anand Malli    schedule 21.01.2010

Нет, вопрос не ясен. В чем именно заключается ваш вопрос?   —  person Anand Malli    schedule 21.01.2010

Вы не задали вопрос. Вы только что опубликовали список желаний.   —  person Anand Malli    schedule 21.01.2010

Если вы имеете в виду синтаксический анализ html, вы можете обратиться к SDK для извлечения данных, который может очень легко извлекать ссылки.   —  person Anand Malli    schedule 21.01.2010

См. также:  Сборка Azure DevOps застряла в очереди при использовании sonarqube
Понравилась статья? Поделиться с друзьями:
IT Шеф
Комментарии: 2
  1. Anand Malli

    Получить веб-страницу в формате HTML. Google (с# извлечение файла из Интернета). Первая ссылка даст вам идею.

    Затем найдите ссылки с регулярными выражениями. Пример шаблона регулярного выражения для ссылок на http://www.x.com должен быть таким (https://www.x.com/.*?) (Но лучше, если вы также включите тег A в свой шаблон регулярного выражения)

    И загрузите файлы, как показано в: https://www.csharp-examples.net/download-files/

  2. Anand Malli

    Надеюсь, я понимаю ваш вопрос. У вас есть файл HTM со списком ссылок, и эти ссылки являются ссылками на определенные файлы на удаленном сервере, и вы хотите загрузить все файлы.

    Нет надежного способа сделать это.

    Проверьте этот вопрос. Как вы анализируете HTML в vb.net Несмотря на то, что это для VB.net, это связано с тем, что вы просили. Вы можете получить массив ссылок, а затем начать загрузку файлов.

    Вы можете использовать метод Computer.Network.DownloadFile для загрузки удаленного файл, как сохранить его в вашем местоположении.

    Это не метод неудачной проверки подлинности, потому что, если для загрузки требуется аутентификация, будет загружена HTML-страница [в основном страница с филейной частью]

Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: