一个浏览器自动化操作的.Net开源库
当前位置:点晴教程→知识管理交流
→『 技术文档交流 』
推荐一个.Net开源库,方便通过高级API来控制Chromium 浏览器。 这是一个基于 Google 开源的 Node.js 库 Puppeteer 的 .NET 开源库,方便开发人员使用无头 Web 浏览器抓取 Web、检索 Javascript 呈现的 HTML,以及与 UI 元素交互等功能。 比如可以用来抓取网页、生成页面 PDF 或者图片、网页截屏,以及进行自动化测试等。 1、操作浏览器:比如新开/关闭浏览器窗口核标签、返回页面、打印页面、重新加载页面等; 2、执行Javascript脚本:执行Js代码/函数等; 3、操作Html页面:比如获取元素的属性、文本内容,插入、更改元素等; 4、模拟鼠标操作:模拟点击页面元素、双击页面元素、拖动页面元素等; 5、模拟键盘输入:输入文字、按下按键、摁住按键等; 6、页面事件:等待页面加载完毕、字体加载等事件。 1、网页截屏 using PuppeteerSharp; using var browserFetcher = new BrowserFetcher(); await browserFetcher.DownloadAsync(); await using var browser = await Puppeteer.LaunchAsync( new LaunchOptions { Headless = true }); await using var page = await browser.NewPageAsync(); await page.GoToAsync("http://www.xxx.com"); var outputFile = "screenshot.jpg"; await page.ScreenshotAsync(outputFile); 2、生成页面PDF using PuppeteerSharp; using var browserFetcher = new BrowserFetcher(); await browserFetcher.DownloadAsync(); await using var browser = await Puppeteer.LaunchAsync(new LaunchOptions { Headless = true }); await using var page = await browser.NewPageAsync(); await page.GoToAsync("http://www.xxx.com"); //等待字体加载完毕 await page.EvaluateExpressionHandleAsync("document.fonts.ready"); var outputFile = "page.pdf"; await page.PdfAsync(outputFile); 3、加载页面并获取页面的所有超链接 using PuppeteerSharp; using System; //浏览器配置 var options = new LaunchOptions { Headless = true }; await new BrowserFetcher().DownloadAsync(); //打开浏览器 using (var browser = await Puppeteer.LaunchAsync(options)) using (var page = await browser.NewPageAsync()) { //加载页面 await page.GoToAsync("http://www.xxx.com"); //获取所有超链接 var jsselectAllAnchors = @"Array.from(document.queryselectorAll('a')).map(a => a.href);"; var urls = await page.EvaluateExpressionAsync<string[]>(jsselectAllAnchors); foreach (string url in urls) { Console.WriteLine($"Url: {url}"); } Console.ReadLine(); } https://github.com/hardkoded/puppeteer-sharp 该文章在 2023/12/13 18:35:11 编辑过 |
关键字查询
相关文章
正在查询... |