Я хочу разработать страницу asp.net, с помощью которой я могу указать URL-адрес любой страницы, содержащей ссылки на множество файлов и каталогов. Я хочу скачать их все. Аналогичен плагину DownThemAll для FireFox.
i.e.
Файл «MyPage.htm» содержит множество ссылок на файлы/каталоги, расположенные на том же сервере.
теперь я хочу написать функцию, которая может загрузить все эти файлы, если я предоставлю
«www.mycustomdomain.com\Mypage.htm» в качестве входных данных.
надеюсь вопрос понятен.
Я предполагаю, что вы рассматриваете только HTTP/HTML? Вы умеете парсить HTML? Взгляните на HTML Agility Pack. — person Anand Malli schedule 21.01.2010
Нет, вопрос не ясен. В чем именно заключается ваш вопрос? — person Anand Malli schedule 21.01.2010
Вы не задали вопрос. Вы только что опубликовали список желаний. — person Anand Malli schedule 21.01.2010
Если вы имеете в виду синтаксический анализ html, вы можете обратиться к SDK для извлечения данных, который может очень легко извлекать ссылки. — person Anand Malli schedule 21.01.2010
Получить веб-страницу в формате HTML. Google (с# извлечение файла из Интернета). Первая ссылка даст вам идею.
Затем найдите ссылки с регулярными выражениями. Пример шаблона регулярного выражения для ссылок на http://www.x.com должен быть таким (https://www.x.com/.*?) (Но лучше, если вы также включите тег A в свой шаблон регулярного выражения)
И загрузите файлы, как показано в: https://www.csharp-examples.net/download-files/
Надеюсь, я понимаю ваш вопрос. У вас есть файл HTM со списком ссылок, и эти ссылки являются ссылками на определенные файлы на удаленном сервере, и вы хотите загрузить все файлы.
Нет надежного способа сделать это.
Проверьте этот вопрос. Как вы анализируете HTML в vb.net Несмотря на то, что это для VB.net, это связано с тем, что вы просили. Вы можете получить массив ссылок, а затем начать загрузку файлов.
Вы можете использовать метод Computer.Network.DownloadFile для загрузки удаленного файл, как сохранить его в вашем местоположении.
Это не метод неудачной проверки подлинности, потому что, если для загрузки требуется аутентификация, будет загружена HTML-страница [в основном страница с филейной частью]