建议你可以尝试去文心一言问下,在实现的过程中遇到问题了,再来这里提问,就比较明确~
如果想将网页转为文档,试试截图提取文字。你要是想问怎么用NET Core自己写的话,。。。。。。
拜拜
有一个工具叫 html2pdf,你百度下载用用看
Playwright.NET 应该就是你需要的 .
using var playwright = await Playwright.CreateAsync();
await using var browser = await playwright.Chromium.LaunchAsync();
var page = await browser.NewPageAsync();
await page.GotoAsync("你需要截屏或者输出pdf的页面地址");
// Generates a PDF with 'screen' media type
await page.EmulateMediaAsync(new() { Media = Media.Screen });
await page.PdfAsync(new() { Path = "page.pdf" });
//截屏存图
await page.ScreenshotAsync(new()
{
Path = "screenshot.png",
FullPage = true,
});
当然除了Playwright外还有 Puppeteer等自动化工具可以满足你的需求!
可以使用aspose,他下边有很多可用的库,比如aspose.html或者aspose.words等等,都十分好用.但是本质上他是付费的,你可以去配置令牌来达到破解的效果.但是不适用于商业用途,商业用途还是走付费渠道吧