首页 新闻 会员 周边 捐助

在线网页转为文档、pdf、图片

0
悬赏园豆:50 [待解决问题]

net core 怎么 将在线网页转为文档、pdf、图片。
或者其他技术能实现也可以。

看,有灰机在飞的主页 看,有灰机在飞 | 初学一级 | 园豆:138
提问于:2023-09-08 14:46
< >
分享
所有回答(8)
0

建议你可以尝试去文心一言问下,在实现的过程中遇到问题了,再来这里提问,就比较明确~

三人乐乐 | 园豆:4823 (老鸟四级) | 2023-09-08 16:46
0

如果想将网页转为文档,试试截图提取文字。你要是想问怎么用NET Core自己写的话,。。。。。。
拜拜

Sawyerhan | 园豆:214 (菜鸟二级) | 2023-09-08 17:26
0

有一个工具叫 html2pdf,你百度下载用用看

jqw2009 | 园豆:2341 (老鸟四级) | 2023-09-09 16:36
0
0Behavior | 园豆:25 (初学一级) | 2023-09-11 10:25
0

Playwright.NET 应该就是你需要的 .

using var playwright = await Playwright.CreateAsync();
await using var browser = await playwright.Chromium.LaunchAsync();
var page = await browser.NewPageAsync();
await page.GotoAsync("你需要截屏或者输出pdf的页面地址");

// Generates a PDF with 'screen' media type
await page.EmulateMediaAsync(new() { Media = Media.Screen });
await page.PdfAsync(new() { Path = "page.pdf" });

//截屏存图
await page.ScreenshotAsync(new()
{
Path = "screenshot.png",
FullPage = true,
});

当然除了Playwright外还有 Puppeteer等自动化工具可以满足你的需求!

万雅虎 | 园豆:326 (菜鸟二级) | 2023-09-12 17:38
0

可以使用aspose,他下边有很多可用的库,比如aspose.html或者aspose.words等等,都十分好用.但是本质上他是付费的,你可以去配置令牌来达到破解的效果.但是不适用于商业用途,商业用途还是走付费渠道吧

辣子鸡好吃 | 园豆:98 (初学一级) | 2023-09-18 10:15
0

将在线网页转换为文档、PDF或图片通常需要使用第三方库或服务,以便捕获和呈现网页内容。以下是一些将在线网页转换为不同格式的一般方法:

  1. 将网页保存为PDF
    • 使用开源库如wkhtmltopdf、Puppeteer(Node.js库),或PhantomJS来渲染网页并将其保存为PDF文档。
    • 在C#中,可以使用DinkToPdf库(wrapper for wkhtmltopdf)或HtmlRenderer.PdfSharp库来实现。
  2. 将网页保存为文档
    • 如果您需要将网页内容保存为文档格式(如Microsoft Word),可以使用一些第三方库来生成Word文档,将网页内容填充到文档中。
  3. 将网页截图为图片
    • 使用浏览器自动化工具(如Puppeteer、Selenium WebDriver)来打开网页、截取屏幕截图,并将其保存为图像文件。
  4. 使用在线转换服务
    • 有一些在线服务(例如,html2pdf、webpage to image)可以接受网页URL并生成PDF或图片文件。您可以通过HTTP请求将网页内容发送给这些服务,并获取转换后的文件。
  5. C#库和工具
    • 在C#中,可以使用一些库来捕获网页内容,例如HtmlAgilityPack或AngleSharp。然后,您可以使用生成库(如iTextSharp)来生成PDF文档,或使用GDI+来将网页内容保存为图像。

在选择适当的方法时,请考虑输出格式、需求、复杂性和性能。不同的任务可能需要不同的工具和技术。

笑叹、 | 园豆:34 (初学一级) | 2023-10-23 14:03
0

可以使用net core 调用 cmd命令 浏览器直接打印网页.
比如 下面的命令可以直接将百度首页打印成pdf保存到d:\temp中:

"C:\Program Files\Google\Chrome\Application\chrome.exe" --headless --disable-gpu --print-to-pdf="d:\temp\12111111.pdf" "https://www.baidu.com/"

隔壁曼玉 | 园豆:217 (菜鸟二级) | 2023-10-25 17:19
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册