# 福昕转换 SDK v3.1.0

发布日期：2026 年 3 月 31 日

## 不兼容变更 

### `PDF2WordSettingData` — 参数变更与默认值变更

参数化构造函数和 `Set()` 方法新增必选参数 `max_blank_paragraphs_per_page_bottom`：

```cpp
// v3.0（4 个参数）
PDF2WordSettingData(bool enable_retain_page_layout,
    bool enable_generate_headers_and_footers,
    bool enable_generate_footnotes_and_endnotes,
    bool enable_generate_page_rendered_break);

// v3.1（5 个参数）
PDF2WordSettingData(bool enable_retain_page_layout,
    bool enable_generate_headers_and_footers,
    bool enable_generate_footnotes_and_endnotes,
    bool enable_generate_page_rendered_break,
    int max_blank_paragraphs_per_page_bottom);  // 新增
```

**所需操作：** 使用参数化构造函数或 `Set()` 时需补充新参数。传 `-1` 表示不限制（与旧版行为一致）。也可改用默认构造函数 + 字段赋值方式，不受影响。

**默认值变更** — `enable_generate_headers_and_footers` 从 `false` 改为 `true`。使用默认构造函数的代码，转换结果将自动生成页眉页脚。如需保持旧版行为，需显式设置 `enable_generate_headers_and_footers = false`。

### `PDF2PowerPointSettingData` — 参数变更

参数化构造函数和 `Set()` 方法新增必选参数 `enable_adapt_to_largest_page`：

```cpp
// v3.0（1 个参数）
PDF2PowerPointSettingData(bool enable_aggressively_split_sections);

// v3.1（2 个参数）
PDF2PowerPointSettingData(bool enable_aggressively_split_sections,
    bool enable_adapt_to_largest_page);  // 新增
```

**所需操作：** 补充新参数，传 `false` 保持旧版行为。

### `PDF2ExcelSettingData` — 参数变更

参数化构造函数和 `Set()` 方法新增 2 个必选参数：

```cpp
// v3.0（3 个参数）
PDF2ExcelSettingData(String decimal_symbol, String thousands_separator,
    WorkbookSettings workbook_settings);

// v3.1（5 个参数）
PDF2ExcelSettingData(String decimal_symbol, String thousands_separator,
    WorkbookSettings workbook_settings,
    bool enable_aggressive_table_repair,  // 新增
    bool include_watermarks);             // 新增
```

**所需操作：** 补充 2 个新参数，传 `true, false` 保持旧版行为。

### `PDF2OfficeSettingData` — 参数变更

参数化构造函数和 `Set()` 方法新增必选参数 `enable_matching_system_fonts`：

```cpp
// v3.0（9 个参数）
PDF2OfficeSettingData(const wchar_t* metrics_data_folder_path,
    bool enable_ml_recognition, const Range& page_range,
    bool include_pdf_comments,
    const PDF2WordSettingData& word_setting_data,
    const PDF2PowerPointSettingData& power_point_setting_data,
    const PDF2ExcelSettingData& excel_setting_data,
    bool enable_trailing_space, bool include_images);

// v3.1（10 个参数）
PDF2OfficeSettingData(/* 同上 9 个参数 */,
    bool enable_matching_system_fonts);  // 新增
```

**所需操作：** 补充新参数，传 `false` 保持旧版行为。

### PDF 转 Word 默认行为变更

PDF 转 Word 现在默认保留文档内部跳转链接。如下游流程依赖无链接的 Word 输出，升级后需验证转换结果。

## 新增功能与增强

### PDF 转 Office

- 新增 `PDF2OfficeSettingData` 的 `enable_matching_system_fonts` 参数，用于 PDF 转 Word 时启用系统字体精准匹配
- 新增 `PDF2PowerPointSettingData` 的 `enable_adapt_to_largest_page` 参数，将混合页面尺寸 PDF 的较小页面自动缩放至最大页面尺寸以统一幻灯片大小
- 改进 PDF 转 Word 转换，默认保留文档内部跳转链接（目录、交叉引用）
- 改进 PDF 转 Word 的转换性能，降低复杂文档的内存占用
- 改进 PDF 转 Word 的标题识别准确率，提升 Word 标题样式映射效果
- 改进 PDF 转 Word 的段落识别、分页符处理及跨页表格连续性

### Office 转 PDF

- 新增 Linux 平台对 `Office2PDFSettingData::is_embed_font` 字体嵌入开关的支持
- 新增 `Office2PDF::ConvertFromWord` 对 DOC（Word 97-2003）格式的支持
- 新增 `e_ErrNotMatchFont` 错误码，用于 Office 转 PDF 时字体缺失场景

### 平台

- 新增 Linux ARM64 .NET Core 平台支持
- 提供中文开发者接口文档

## 问题修复

### PDF 转 Word

- 修复在 Linux .NET 平台上将特定 PDF 文件转换为 Word 时崩溃的问题
- 修复特定文档 PDF 转 Word 时无法生成输出文件且无明确错误提示的问题
- 修复在 Debug x86 模式下某些 MFC 项目中 PDF 转 Word 时出现异常（`0x77574080 ntdll.dll`）的问题
- [Linux] 修复宋体在转换后的 Word 输出中被错误渲染为黑体的字体替换问题
- 改进字体选择策略，避免使用 Segoe UI Light 以提升 WPS Office 跨应用兼容性
- 修复转换后 Word 文档中字体样式（如加粗）丢失的问题
- 修复 PDF 转 Word 时字号不正确导致布局错乱的问题
- 修复转换后 Word 文档段落内字符间出现多余空格的问题
- 修复转换后 Word 文档中标题字符重叠的问题
- 改进翻译回填工作流的布局稳定性，修复翻译后较长文本导致后续页面布局混乱的问题
- 修复页面四角生成裁切线影响第三方翻译软件处理的问题
- 修复转换后 Word 文档中目录对齐错位的问题
- 修复特定文件转换后 Word 文档中出现布局错位的问题
- 修复 PDF 页眉页脚被错误转换为正文文本而非 Word 页眉/页脚区域的问题
- 修复文本行末多余换行符在翻译回填时导致布局错乱的问题
- 修复阿拉伯语文档 PDF 转 Word 时内容丢失的问题
- 改进大型文档的转换质量：减少布局问题、输出文件体积膨胀和页数增长
- 改进 Microsoft Office 与 WPS Office 之间的跨应用渲染一致性
- 修复特定文件转换时文字变淡、表格渲染异常、内容丢失及文本重叠的问题
- 修复 PDF 转 Word 时目录丢失或损坏、标题未被正确识别的问题
- 修复 `PDF2WordSettingData` 中 `enable_generate_headers_and_footers = true` 不生效的问题

### PDF 转 Excel

- 修复 PDF 转 Excel 时单元格文本被放置在绘图形状内而非可编辑单元格中的问题
- 修复转换耗时过长且表格结构不正确、单元格以图像形式呈现的问题
- 修复使用内置测试文档转换为 Excel 时内容丢失的问题

### Word 转 PDF

- 修复 `Office2PDF::ConvertFromWord` 转换特定 DOCX 文件时崩溃的问题
- 修复转换特定 Word 文件时内存飙升至 4 GB 导致卡死的问题
- 修复 Word 转 PDF 时特定表格区域内容丢失的问题
- 改进 Windows 平台上的字符间距和段落布局还原度
- 修复 Windows 平台上 `Office2PDFSettingData` 中 `is_embed_font = true` 不生效的问题
- [Linux] 修复缺少 Calibri 字体的 Red Hat 系统上 Word 转 PDF 输出空白的问题
- 修复字符间距不正确导致换行位置与原始 Word 文档不同的问题
- 修复加粗文本在转换后的 PDF 中显示过粗的问题
- 修复特定文档的最后一句话在输出 PDF 中丢失的问题
- 修复图形形状渲染偏差和文本换行错误的问题

---

# 福昕转换 SDK v3.0.0

发布日期：2025 年 7 月 31 日

## 不兼容变更 

- Linux GCC 最低支持版本从 4.9.4 变更为 5.4
- Node.js 库不再支持 Node.js v8 和 v9

## 新增功能与增强

### PDF 转 Office

- 新增 Linux 32/64 位平台的 Go 语言支持
- 新增 Python ABI3 兼容性，扩展 Python 版本支持范围
- 改进文本段落识别效果，减少文本框输出
- 改进转换稳定性与结果标准化程度
- 改进边框表格识别能力
- 改进 PDF 转 Word 的嵌套表格输出外观效果
- 改进 PDF 转 Word 的页眉页脚识别能力
- 改进 PDF 转 Word 的标题识别效果
- 改进 PDF 转 Excel 的表格输出质量

### Office 转 PDF

- 新增 Linux 系统平台支持
- 改进字体加载方式，提升转换速度
- 新增 Word 转 PDF 的 Drawing 和 Paragraph 多层嵌套支持
- 新增 Word 转 PDF 的 Drawing 对象段落纵向排版支持
- 新增 PPT 转 PDF 的 PowerPoint 页面级跳转支持

## 问题修复

### PDF 转 Word

- 修复转换后的 Word 文档内容无法编辑的问题
- 修复 GSDK 10.0 Java Linux 版本在 PDF 转 Word 转换压力测试中崩溃的问题
- 修复 PDF 转 Word 转换过程中程序卡住无法输出结果的问题

### PDF 转 PowerPoint

- 修复 PDF 转 PPT 时多出一个灰色背景块的问题

### Word 转 PDF

- 修复含嵌套 Drawing 和 Paragraph 元素的复杂 Word 布局转换不正确的问题
- 修复 Drawing 对象的段落纵向排版无法正确渲染的问题
- 修复多层 Drawing 对象叠加显示不正确的问题
- 修复 PowerPoint 页面级跳转功能不支持的问题

---

# 福昕转换 SDK v2.1.0

发布日期：2024 年 12 月 16 日

## 新增功能与增强

### PDF 转 Office

- 新增 `PDF2WordSettingData` 的 `enable_generate_page_rendered_break` 参数，支持页面分页符插入选项
- 新增 `PDF2OfficeSettingData` 的尾部空格移除和图片包含选项
- 新增 `PDF2ExcelSettingData` 的 Excel 工作簿设置
- 新增受限 PDF 文件的转换支持
- 新增 `ConvertCheckCallback` 类和 `SetConvertCheckCallback()` 用于转换校验
- 更新 `PDF2Office::Initialize()` 以支持 `fx_binary_program_path` 参数，提升转换灵活性
- 改进 PDF 转 Word 的表格、公式和高亮文本识别准确率
- 改进 PDF 转 Excel 的单元格边框和背景识别保真度
- 改进 PDF 转 PPT 的文本和路径内容完整性
- 改进复杂路径结构文件的处理效率
- 改进整体程序稳定性，防止内存泄漏

### Office 转 PDF

- 新增 Word 转 PDF 的大纲转换支持，通过 `Word2PDFConfig` 配置
- 新增 Excel 转 PDF 的工作簿转换选项，通过 `Excel2PDFConfig` 配置
- 改进对复杂布局（包括纵向文本）的支持
- 改进渐变、多列对齐和 3D 元素的保留效果
- 通过内存优化改进大文件转换的稳定性和效率

---

# 福昕转换 SDK v2.0.0

发布日期：2024 年 3 月 18 日

## 新增功能与增强

### Office 转 PDF

- 新增 Windows 平台 Office 转 PDF 转换支持（Word、Excel、PowerPoint）— beta

### PDF 转 Office

- 新增 PDF 转 Word 的脚注和尾注生成功能，通过 `enable_generate_footnotes_and_endnotes` 参数控制
- 新增 PDF 转 Word 的页眉页脚生成功能，通过 `enable_generate_headers_and_footers` 参数控制
- 新增 `PDF2ExcelSettingData` 类，用于配置小数符号和千位分隔符
- 改进 PDF 转 PowerPoint 的文本块识别准确率

### 平台

- 新增 Dotnet/DotNetCore 的 AnyCPU 配置支持

## 问题修复

- 修复因内存占用过高导致转换失败或速度变慢的问题
- 修复 PDF 转 PPT 时转换含无边框表格的特定页面导致崩溃的问题
- 修复文本转换异常，包括字体不一致、文本被渲染为图像、文本缺失、位置偏移和文本重叠
- 修复 PDF 转 Word 中下划线识别不正确以及额外空格/换行符的问题
- 修复 PDF 转 PPT 中文本内容被错误识别为表格的问题
- 修复 PDF 转 Excel 中多行文本被放置在同一单元格中的问题
- 修复 PDF 转 Word 中页码不一致和单页被拆分为多页的问题

---

# 福昕转换 SDK v1.5.0

发布日期：2023 年 11 月 7 日

## 新增功能与增强

### PDF 转 Office

- 新增 `PDF2OfficeSettingData` 的页面范围、PDF 注释包含和页面布局保留设置
- 改进楷体字体支持
- 改进图表识别和输出显示效果
- 改进 WPS Office 兼容性，确保格式和字体颜色一致

## 问题修复

### PDF 转 Word

- 修复文本样式不正确的问题，包括加粗格式缺失和字号不一致
- 修复转换后文本重叠的问题
- 修复页面级大纲识别和输出问题
- 修复特定文件中列表识别失败的问题
- 修复高亮样式和注释显示问题
- 修复转换后 Word 和 PDF 之间水印布局不一致的问题
- 修复文档属性中标题和作者信息缺失的问题
- 修复特定文件转换后页数增加的问题
- 修复双布局内容中文本对象被错误识别为形状对象的问题
- 修复转换结果中生成多余空段落的问题

### PDF 转 Excel

- 修复特定文件转换时处理时间过长和程序冻结的问题
- 修复转换后单元格内数字显示不完整的问题
- 修复转换后单元格内文本尺寸缩小的问题
- 修复转换后单元格内容偏移的问题
- 修复转换后单元格内容自动换行的问题
- 修复转换后单元格背景缺失的问题

---

# 福昕转换 SDK v1.4.0

发布日期：2023 年 8 月 22 日

## 新增功能与增强

### PDF 转 Office

- 新增 PDF 转 Word 的标题转换支持

### 平台

- 新增 Linux C 库支持
- 更新 Node.js 兼容性至最新版本

## 问题修复

- 更新 OpenSSL 至 1.1.1 版本以修复已知漏洞
- 修复 PDF 转 Word 中数字编号样式变化的问题
- 修复 PDF 转 Word 中项目符号对齐错位的问题
- 修复 PDF 转 Excel 输出在 WPS Office 中打开时内容显示不一致的问题
- 修复转换后的文件在不同 Office 编辑器中显示不一致的问题
- 修复特定文件 PDF 转 Word 时字体缺失和字体外观不一致的问题
- 修复 PDF 转 Word 中 Calibri 字体被替换为其他字体的问题
- 修复 PDF 转 Excel 中表格列宽缩小导致数据列内对齐错位的问题
- 修复 PDF 转 Excel 中纯色单元格背景未被正确识别的问题
- 修复在特定设备的 Office 编辑器中放大 PDF 转 Excel 输出后文本不可见的问题

---

# 福昕转换 SDK v1.3.0

发布日期：2023 年 6 月 9 日

## 新增功能与增强

### PDF 转 Office

- 新增裁剪路径文本识别和转换功能
- 新增 PDF 转 Word 中弹出式注释及回复到 Word 审阅批注的转换

### 平台

- 新增 Linux 平台支持
- 新增多线程和线程安全支持

## 问题修复

- 修复特定文件转换后输出中空格缺失的问题
- 修复下划线文本识别和转换不正确的问题
- 修复特定文件中文本被转换为图像的问题
- 修复 Office 转换中的崩溃和内存泄漏问题
- 修复含高亮 StyleSpan 文本转换后段落格式对齐错位的问题

---

# 福昕转换 SDK v1.2.0

发布日期：2023 年 4 月 4 日

## 新增功能与增强

### 平台

- 新增托管在 GitHub 上的 Node.js 转换库
- 新增 Visual Studio 2019 和 2022 Demo 项目

---

# 福昕转换 SDK v1.1.0

发布日期：2023 年 3 月 3 日

## 新增功能与增强

### PDF 转 Office

- 新增基于机器学习 HTTP Restful API 的 AI 无边框表格识别功能（`enable_ml_recognition` 选项）

---

# 福昕转换 SDK v1.0.0

发布日期：2023 年 1 月 17 日

## 新增功能与增强

- 初始版本，支持 Windows 平台上 PDF 转 Word、PDF 转 Excel、PDF 转 PowerPoint 转换
- 支持语言：C/C++、C#（DotNet、DotNetCore）、Java、Node.js、Python
