|
Foxit PDF SDK
|
Public 属性 | |
| confidence | |
| 用于确定识别的文本是否可靠的置信度阈值。 更多... | |
| is_auto_overwrite_resolution | |
| 决定是否自动设置分辨率。 更多... | |
| is_correct_skew | |
| 决定是否启用倾斜校正。true 表示启用倾斜校正。 false 表示不启用倾斜校正。 默认值:true。 更多... | |
| is_detect_pictures | |
| 决定是否检测图片。true 表示将在分析过程中检测图片。 false 表示不检测图片,PDF 文档图像上的图片内容可能被解释为文本。 如果您只想从图像中提取文本,则可以将此选项设置为 false。 默认值:true。 | |
| is_enable_text_extraction_mode | |
| 决定是否启用文本提取模式。 更多... | |
| is_remove_noise | |
| 决定是否移除 PDF 图像的噪点。如果 PDF 的图像包含一些噪点, 例如随机的黑色点或斑点,这可能很有用。如果图像上的字母线条很细,则应将此选项设置为 false, 否则会影响文本的识别。 true 表示在 OCR 过程中不会识别图像中的噪点。噪点不会被识别为文本。 false 表示不阻止噪点。 默认值:true。 | |
| is_sequentially_process | |
| 决定 OCR 引擎是否将在一个进程上顺序处理页面。 更多... | |
| resolution_to_overwrite | |
| 用于覆盖 PDF 文档图像分辨率的分辨率(DPI)。 更多... | |
此类表示用于 OCR 的配置。
| FSDK::OCRConfig::constructor | ( | is_detect_pictures | , |
| is_remove_noise | , | ||
| is_correct_skew | , | ||
| is_enable_text_extraction_mode | , | ||
| is_sequentially_process | , | ||
| is_auto_overwrite_resolution | , | ||
| resolution_to_overwrite | , | ||
| confidence | |||
| ) |
带参数的构造函数。
| [in] | is_detect_pictures | 决定是否检测图片。 |
| [in] | is_remove_noise | 决定是否移除 PDF 图像的噪点。 |
| [in] | is_correct_skew | 决定是否启用倾斜校正。 |
| [in] | is_enable_text_extraction_mode | 决定是否启用文本提取模式。 |
| [in] | is_sequentially_process | 决定 OCR 引擎是否将在一个进程上顺序处理页面。 |
| [in] | is_auto_overwrite_resolution | 决定是否自动覆盖分辨率。 |
| [in] | resolution_to_overwrite | 要覆盖的分辨率。此参数仅在参数 is_auto_overwrite_resolution 设置为 false 时有效。 |
| [in] | confidence | 用于确定识别的文本是否可靠的置信度阈值。值范围从 0 到 100。 |
| FSDK::OCRConfig::Set | ( | is_detect_pictures | , |
| is_remove_noise | , | ||
| is_correct_skew | , | ||
| is_enable_text_extraction_mode | , | ||
| is_sequentially_process | , | ||
| is_auto_overwrite_resolution | , | ||
| resolution_to_overwrite | , | ||
| confidence | |||
| ) |
设置值。
| [in] | is_detect_pictures | 决定是否检测图片。 |
| [in] | is_remove_noise | 决定是否移除 PDF 图像的噪点。 |
| [in] | is_correct_skew | 决定是否启用倾斜校正。 |
| [in] | is_enable_text_extraction_mode | 决定是否启用文本提取模式。 |
| [in] | is_sequentially_process | 决定 OCR 引擎是否将在一个进程上顺序处理页面。 |
| [in] | is_auto_overwrite_resolution | 决定是否自动覆盖分辨率。 |
| [in] | resolution_to_overwrite | 要覆盖的分辨率。此参数仅在参数 is_auto_overwrite_resolution 设置为 false 时有效。 |
| [in] | confidence | 用于确定识别的文本是否可靠的置信度阈值。值范围从 0 到 100。 |
| FSDK::OCRConfig::confidence |
用于确定识别的文本是否可靠的置信度阈值。
值范围为 [0, 100]。值越大,置信度要求越高。 例如,如果此值设置为 30,置信度低于 30 的识别文本 将被视为不可靠文本,并且识别的文本将被移除。 默认值:0。
| FSDK::OCRConfig::is_auto_overwrite_resolution |
决定是否自动设置分辨率。
true 表示 OCR 引擎将自动检测并覆盖图像分辨率。 false 表示通过参数 resolution_to_overwrite 手动设置分辨率。
| FSDK::OCRConfig::is_correct_skew |
决定是否启用倾斜校正。true 表示启用倾斜校正。 false 表示不启用倾斜校正。 默认值:true。
| FSDK::OCRConfig::is_enable_text_extraction_mode |
决定是否启用文本提取模式。
通常,当文本的某些部分未被找到为文本块时(例如图片上的文本或手写文本), 建议将此参数设置为 true。 如果图片的完整文本被正确识别,或样本包含可能被认为并识别为文本的图像或图案, 建议将此参数设置为 false。 简而言之,此参数使引擎能够将与字母远程相近的任何内容识别为文本。 true 表示启用文本提取模式,而 false 表示不启用文本提取模式。 默认值:false。
| FSDK::OCRConfig::is_sequentially_process |
决定 OCR 引擎是否将在一个进程上顺序处理页面。
此参数仅用于 OCR 转换。true 表示 OCR 引擎将在一个进程上顺序处理页面, 并且转换时间将增加。
false 表示 OCR 引擎将自动检测进程数。如果只处理一个页面或系统中只有一个处理器, 则使用一个进程。否则,使用并行处理。
默认值:false。
| FSDK::OCRConfig::resolution_to_overwrite |
用于覆盖 PDF 文档图像分辨率的分辨率(DPI)。
此参数仅在参数 is_auto_overwrite_resolution 设置为 false 时有效。 默认值:300。