15 #ifndef FS_LAYOUTRECOGNITION_H_ 16 #define FS_LAYOUTRECOGNITION_H_ 35 namespace layoutrecognition {
47 typedef enum _ElementType {
431 typedef enum _AttributeType {
905 typedef enum _AttributeValueEnum {
1362 typedef enum _AttributeValueType {
1864 #endif // FS_LAYOUTRECOGNITION_H_ Definition: fs_pdfgraphicsobject.h:232
结构元素类型:DocumentFragment(PDF 2.0),表示原始完整文档的一部分。
Definition: fs_layoutrecognition.h:51
枚举值:LineThrough,表示穿过文本中间的线条。
Definition: fs_layoutrecognition.h:1162
值类型:元素。
Definition: fs_layoutrecognition.h:1376
结构元素类型:TD,意为"Table data cell",表示 包含表格内容部分数据的表格单元格。
Definition: fs_layoutrecognition.h:171
Matrix GetMatrix() const
获取矩阵。
枚举值:Inset,表示边框使整个框看起来像嵌入画布中。
Definition: fs_layoutrecognition.h:1081
属性类型:Color,表示用于绘制文本的颜色以及表格边框和文本装饰的默认颜色值。
Definition: fs_layoutrecognition.h:578
AttributeValueEnum
元素通用布局属性枚举值的枚举。
Definition: fs_layoutrecognition.h:905
结构元素类型:Hn(PDF 2.0),表示7级或更高级别的标题。
Definition: fs_layoutrecognition.h:135
bool IsEmpty() const
检查当前对象是否为空。
结构元素类型:AnnotContent,表示标注内容元素。
Definition: fs_layoutrecognition.h:310
common::Range GetGraphicsObjectRange()
获取当前内容元素在当前图形对象中的范围。
pdf::objects::PDFDictionary * GetDict() const
获取相关图形对象的PDF字典。
LRElement()
构造函数。
Definition: fs_layoutrecognition.h:315
枚举值:Row,表示表格的行。
Definition: fs_layoutrecognition.h:1278
枚举值:TbRl,表示从上到下的行进方向;从右到左的块进方向。
Definition: fs_layoutrecognition.h:1010
LRGraphicsObjectElement()
构造函数。
Definition: fs_layoutrecognition.h:1634
属性类型:ColumnWidths,表示列的期望宽度,在内联进展方向上测量。
Definition: fs_layoutrecognition.h:777
枚举值:rb,表示单选按钮。
Definition: fs_layoutrecognition.h:1236
结构元素类型:ContainerObject,表示容器对象元素。
Definition: fs_layoutrecognition.h:294
Definition: fs_common.h:1364
属性类型:TextDecorationThickness,表示作为文本装饰一部分绘制的每条线的厚度。
Definition: fs_layoutrecognition.h:700
属性类型:BBox,表示元素的边界框(完全包含其可见内容的矩形)。
Definition: fs_layoutrecognition.h:484
结构元素类型:PathContent,表示路径内容元素。
Definition: fs_layoutrecognition.h:302
枚举值:Bottom,表示页面的下边缘。
Definition: fs_layoutrecognition.h:1308
结构元素类型:Figure,表示图形内容项。
Definition: fs_layoutrecognition.h:270
枚举值:Decimal,表示十进制阿拉伯数字(1-9, 10-99, ...)。
Definition: fs_layoutrecognition.h:1192
AttributeType
元素通用布局属性类型的枚举。
Definition: fs_layoutrecognition.h:431
int GetAttributeValueCount(AttributeType type)
获取指定属性类型的值数量。
仅适用于Table的属性类型:Scope,指示标题单元格是否适用于 包含它的行中的其余单元格、包含它的列或 包含它的行和列。
Definition: fs_layoutrecognition.h:858
static String StringifyElementType(ElementType type)
将指定元素类型的枚举值转换为简短且易记的字符串(文本)表示。
结构元素类型:Caption,表示描述表格或图形的 简短文本部分。
Definition: fs_layoutrecognition.h:79
枚举值:Pagination,表示分页工件。辅助页面功能,如页眉页脚和页码。
Definition: fs_layoutrecognition.h:1320
枚举值:neutral,表示状态为中立。
Definition: fs_layoutrecognition.h:1272
bool operator==(const LRContext &other) const
等于运算符。
结构元素类型:NonStruct,意为"Nonstructural element",表示 没有固有结构意义的分组元素;它仅用于分组目的。
Definition: fs_layoutrecognition.h:109
枚举值:Other(PDF 2.0)。
Definition: fs_layoutrecognition.h:1354
bool operator !=(const LRElement &other) const
不等于运算符。
结构元素类型:Em(PDF 2.0),意为"Emphasis",表示用于强调目的的内容。
Definition: fs_layoutrecognition.h:258
仅适用于PrintField的属性类型:Role,表示此图形所代表的表单字段类型。
Definition: fs_layoutrecognition.h:809
结构元素类型:TOC,意为"Table of contents",表示 由目录项条目和/或其他嵌套目录条目组成的列表。
Definition: fs_layoutrecognition.h:84
结构元素类型:Form,表示代表交互式表单字段的 小部件标注。
Definition: fs_layoutrecognition.h:277
结构元素类型:ShadingObject,表示阴影图形对象元素。
Definition: fs_layoutrecognition.h:290
属性类型:InlineAlign,表示表格单元格内容在内联进展方向上的对齐方式。
Definition: fs_layoutrecognition.h:645
枚举值:Block,表示在封闭的参考区域或父BLSE内按块进展方向堆叠。
Definition: fs_layoutrecognition.h:913
属性类型:Subtype,表示注释或工件的子类型。
Definition: fs_layoutrecognition.h:565
属性类型:Height,表示元素内容矩形的高度。
Definition: fs_layoutrecognition.h:496
int GetSupportedAttributeCount()
获取支持的属性数量。
属性类型:Attached,指定工件在逻辑上附加到页面的边缘(如果有的话)。
Definition: fs_layoutrecognition.h:548
仅适用于Table的属性类型:Summary,表示表格用途和结构的摘要, 用于非视觉渲染,如语音或盲文。
Definition: fs_layoutrecognition.h:865
枚举值:Disc,表示实心圆形项目符号。
Definition: fs_layoutrecognition.h:1174
结构元素类型:Art,意为"Article",表示构成单一叙述或阐述的 相对独立的文本主体。
Definition: fs_layoutrecognition.h:58
枚举值:Justify,表示属性TextAlign/BlockAlign/RubyAlign的对齐。
Definition: fs_layoutrecognition.h:1138
枚举值:on,表示状态为开启。
Definition: fs_layoutrecognition.h:1260
结构元素类型:P,意为"Paragraph",表示文本的低级划分。
Definition: fs_layoutrecognition.h:116
int32 GetAttributeValueInt32(AttributeType type, int index)
获取指定属性类型的整数值(由索引指定)。
结构元素类型:ComplexContent,表示复杂内容元素。
Definition: fs_layoutrecognition.h:308
(当前不支持)仅适用于Table的属性类型:Headers,表示元素标识符数组。
Definition: fs_layoutrecognition.h:845
属性类型:Width,表示元素内容矩形的宽度。
Definition: fs_layoutrecognition.h:490
bool IsStructureElement() const
检查当前对象是否为结构元素。
枚举值:float。
Definition: fs_layoutrecognition.h:1230
AttributeValueEnum GetAttributeValueEnum(AttributeType type, int index)
获取指定属性类型的枚举值(由索引指定)。
结构元素类型:Title(PDF 2.0),表示通常被称为文档或高级内容划分标题的内容。
Definition: fs_layoutrecognition.h:101
枚举值:tv,表示文本值字段。
Definition: fs_layoutrecognition.h:1254
结构元素类型:AnnotObject,表示标注对象元素。
Definition: fs_layoutrecognition.h:296
~LRContentElement()
析构函数。
Definition: fs_layoutrecognition.h:1729
属性类型:无效。
Definition: fs_layoutrecognition.h:433
枚举值:None,表示没有此类属性。
Definition: fs_layoutrecognition.h:1025
RectF GetBBox() const
获取边界框。
宽字符串类
Definition: fx_string.h:1457
枚举值:Auto。
Definition: fs_layoutrecognition.h:1110
属性类型:ColumnGap,表示相邻列之间的期望空间,在内联进展方向上测量。
Definition: fs_layoutrecognition.h:765
结构元素类型:WT,意为"Warichu text",表示 割注注释的较小尺寸文本,格式化为两行并放置在周围WP元素之间。
Definition: fs_layoutrecognition.h:249
static String StringifyAttributeType(AttributeType type)
将指定属性类型的枚举值转换为简短且易记的字符串(文本)表示。
值类型:ARGB颜色类型,32位,((b) | ((g) << 8) | ((r) << 16)) | ((a) << 24)。
Definition: fs_layoutrecognition.h:1372
结构元素类型:Code,表示计算机程序文本片段。
Definition: fs_layoutrecognition.h:213
结构元素类型:Aside(PDF 2.0),表示与其父结构元素内 其他内容不同的内容。
Definition: fs_layoutrecognition.h:99
结构元素类型:Annot,意为"Annotation",表示 ILSE内容的一部分与相应PDF标注之间的关联。
Definition: fs_layoutrecognition.h:223
ElementType GetElementType()
获取元素类型。
值类型:宽字符串数组。
Definition: fs_layoutrecognition.h:1386
Definition: fs_layoutrecognition.h:1631
枚举值:Overline,表示文本上方的线条。
Definition: fs_layoutrecognition.h:1156
枚举值:Middle,表示子元素在表格单元格内居中。
Definition: fs_layoutrecognition.h:1144
枚举值:LrTb,表示从左到右的行进方向;从上到下的块进方向。
Definition: fs_layoutrecognition.h:997
属性类型:EndIndent,表示从BLSE的结束边缘到参考区域结束边缘的距离。
Definition: fs_layoutrecognition.h:602
属性类型:WritingMode,表示ILSE打包(内联进程)和BLSE堆叠(块进程)的 布局进展方向。
Definition: fs_layoutrecognition.h:471
结构元素类型:H5,表示5级标题。
Definition: fs_layoutrecognition.h:131
LRGraphicsObjectElement GetGraphicsObjectElement() const
获取相关的图形对象元素。
结构元素类型:Lbl,意为"Label",表示用于区分给定项目与 同一列表或其他类似项目组中其他项目的名称或编号。
Definition: fs_layoutrecognition.h:146
属性类型:SpaceBefore,表示BLSE前边缘之前的额外空间量。
Definition: fs_layoutrecognition.h:584
枚举值:Page,表示页面工件。与文档本身无关的生产辅助工具,如裁切标记和色彩条。
Definition: fs_layoutrecognition.h:1332
结构元素类型:Strong(PDF 2.0),表示用于 强烈重要性、严肃性或紧迫性的内容。
Definition: fs_layoutrecognition.h:263
结构元素类型:BibEntry,意为"Bibliography entry",表示 标识某些引用内容外部来源的参考文献。
Definition: fs_layoutrecognition.h:211
结构元素类型:L,意为"List",表示具有相似含义和重要性的项目序列。
Definition: fs_layoutrecognition.h:139
属性类型:role,表示结构元素含义和它映射到的标准类型的字符串。
Definition: fs_layoutrecognition.h:439
属性类型:Destination(PDF 2.0),提供访问内容的方法。
Definition: fs_layoutrecognition.h:477
LRElement & operator=(const LRElement &other)
赋值运算符。
属性类型:TextDecorationColor,表示用于绘制文本装饰的颜色。
Definition: fs_layoutrecognition.h:694
枚举值:RlTb,表示从右到左的行进方向; 从上到下的块进方向。
Definition: fs_layoutrecognition.h:1004
static String StringifyEnumVariant(AttributeValueEnum type)
将指定属性值枚举的枚举值转换为简短且易记的字符串(文本)表示。
值类型:浮点数值数组。
Definition: fs_layoutrecognition.h:1382
属性类型:BorderColor,表示在表格单元格或任何元素内容矩形边缘绘制的边框颜色。
Definition: fs_layoutrecognition.h:508
仅适用于Table的属性类型:RowSpan,表示单元格跨越的封闭表格中的行数。
Definition: fs_layoutrecognition.h:833
枚举值:Left,表示页面的左边缘。
Definition: fs_layoutrecognition.h:1296
属性类型:BlockAlign,表示表格单元格内容在块进展方向上的对齐方式。
Definition: fs_layoutrecognition.h:634
属性类型:RubyPosition,表示假名注音组合中RT结构元素相对于RB元素的位置。
Definition: fs_layoutrecognition.h:739
结构元素类型:LBody,意为"List body",表示 列表项的描述性内容。
Definition: fs_layoutrecognition.h:151
属性类型:TBorderStyle,表示在表格单元格每个边缘绘制的边框样式。
Definition: fs_layoutrecognition.h:664
属性类型:BorderThickness,表示在表格单元格或任何元素内容矩形边缘绘制的边框厚度。
Definition: fs_layoutrecognition.h:535
枚举值:Warichu,表示RT和相关的RP元素应格式化为割注,跟随RB元素。
Definition: fs_layoutrecognition.h:931
枚举值:Unordered(PDF 2.0),表示具有未指定项目符号的无序列表。
Definition: fs_layoutrecognition.h:1222
枚举值:PageNum(PDF2.0)。
Definition: fs_layoutrecognition.h:1346
WString GetAttributeValueString(AttributeType type, int index)
获取指定属性类型的字符串值(由索引指定)。
static bool IsArrayAttributeValueType(AttributeValueType type)
检查输入的属性值类型是否表示数组。
结构元素类型:H4,表示4级标题。
Definition: fs_layoutrecognition.h:129
枚举值:LowerAlpha,表示小写字母(a, b, c, ...)。
Definition: fs_layoutrecognition.h:1216
属性类型:Rotation
Definition: fs_layoutrecognition.h:458
枚举值:Start,表示属性Placement的位置,或属性TextAlign/InlineAlign/RubyAlign的对齐。
Definition: fs_layoutrecognition.h:975
结构元素类型:ImageContent,表示图像内容元素。
Definition: fs_layoutrecognition.h:304
枚举值:Header。
Definition: fs_layoutrecognition.h:1340
uint32 ARGB
ARGB 颜色类型,32 位,((b) | ((g) << 8) | ((r) << 16)) | ((a) << 24)
Definition: fs_basictypes.h:210
枚举值:Right,表示页面的右边缘。
Definition: fs_layoutrecognition.h:1314
bool IsEmpty() const
检查当前对象是否为空。
属性类型:RubyAlign,表示假名注音组合内行的对齐方式。
Definition: fs_layoutrecognition.h:727
LRStructureElement GetParentElement() const
获取父元素。
LRStructureElement GetRootElement()
获取结构树的根元素。
结构元素类型:Link,表示ILSE内容的一部分与 相应链接标注之间的关联。
Definition: fs_layoutrecognition.h:218
结构元素类型:H3,表示3级标题。
Definition: fs_layoutrecognition.h:127
枚举值:Double,表示边框是两条实线。
Definition: fs_layoutrecognition.h:1060
LRElement GetChild(int index)
通过索引获取子元素。
结构元素类型:H2,表示2级标题。
Definition: fs_layoutrecognition.h:125
结构元素类型:FENote(PDF 2.0),用于标记脚注和尾注。
Definition: fs_layoutrecognition.h:104
枚举值:Before,表示属性Placement/RubyPosition的位置或属性BlockAlign的对齐。
Definition: fs_layoutrecognition.h:947
LRContentElement()
构造函数。
Definition: fs_layoutrecognition.h:1709
结构元素类型:TextContent,表示文本内容元素。
Definition: fs_layoutrecognition.h:300
值类型:枚举值数组。
Definition: fs_layoutrecognition.h:1378
Definition: fx_basic.h:3737
枚举值:Ordered(PDF 2.0),表示具有未指定编号的有序列表。
Definition: fs_layoutrecognition.h:1228
AttributeValueType GetAttributeValueType(AttributeType type)
获取指定属性类型的属性值类型。
结构元素类型:Formula,表示数学公式。
Definition: fs_layoutrecognition.h:272
枚举值:Top,表示页面的上边缘。
Definition: fs_layoutrecognition.h:1302
枚举值:Dotted,表示边框是一系列点。
Definition: fs_layoutrecognition.h:1039
~LRGraphicsObjectElement()
析构函数。
Definition: fs_layoutrecognition.h:1654
仅适用于List的属性类型:ListNumbering,表示用于生成自动编号列表中 Lbl(标签)元素内容的编号系统,或用于标识非编号列表中每个项目的符号。
Definition: fs_layoutrecognition.h:797
结构元素类型:Sub(PDF 2.0),意为"Sub-division of a block level element",表示 通常被认为是块级结构元素内部细分的内容。
Definition: fs_layoutrecognition.h:268
LRStructureElement()
构造函数。
Definition: fs_layoutrecognition.h:1393
枚举值:Both,表示表格的行和列。
Definition: fs_layoutrecognition.h:1290
无效的枚举值。
Definition: fs_layoutrecognition.h:907
属性类型:SpaceAfter,表示BLSE后边缘之后的额外空间量。
Definition: fs_layoutrecognition.h:590
仅适用于PrintField的属性类型:checked,表示单选按钮或复选框字段的状态。
Definition: fs_layoutrecognition.h:820
结构元素类型:TextObject,表示文本图形对象元素。
Definition: fs_layoutrecognition.h:284
结构元素类型:BlockQuote,意为"Block quotation",表示 由一个或多个段落组成的文本部分,归属于 周围文本作者以外的人。
Definition: fs_layoutrecognition.h:74
结构元素类型:Private,意为"Private element",表示 包含生成应用程序私有内容的分组元素。
Definition: fs_layoutrecognition.h:114
结构元素类型:Sect,意为"Section",表示用于 分组相关内容元素的容器。
Definition: fs_layoutrecognition.h:63
Definition: fs_common.h:373
Matrix GetMatrix() const
获取矩阵。
枚举值:Square,表示实心方形项目符号。
Definition: fs_layoutrecognition.h:1186
属性类型:Placement,表示元素相对于封闭参考区域和其他内容的定位。
Definition: fs_layoutrecognition.h:452
结构元素类型:RB,意为"Ruby base text",表示 应用假名注音的全尺寸文本。
Definition: fs_layoutrecognition.h:230
值类型:枚举。
Definition: fs_layoutrecognition.h:1366
属性类型:TPadding,指定用于表格单元格内容矩形与周围边框之间分离的偏移。
Definition: fs_layoutrecognition.h:672
Definition: fs_pdfpage.h:421
属性类型:ColumnCount,表示分组元素内容中的列数。
Definition: fs_layoutrecognition.h:752
void * FS_HANDLE
句柄类型。
Definition: fs_basictypes.h:214
属性类型:TextIndent,表示从BLSE的开始边缘(由 LRStructureElement::e_AttributeTypeStartIndent指定) 到第一行文本的额外距离。
Definition: fs_layoutrecognition.h:610
结构元素类型:Artifact,包括其他分页、布局、 页面和背景人工制品。
Definition: fs_layoutrecognition.h:282
结构元素类型:Span,表示没有特定固有特征的 通用内联文本部分。
Definition: fs_layoutrecognition.h:191
float GetAttributeValueFloat(AttributeType type, int index)
获取指定属性类型的浮点值(由索引指定)。
空值类型。
Definition: fs_layoutrecognition.h:1364
int GetChildCount()
获取子元素的数量。
~LRStructureElement()
析构函数。
Definition: fs_layoutrecognition.h:1413
结构元素类型:TBody,意为"Table body row group",表示 构成表格主体部分的行组。
Definition: fs_layoutrecognition.h:181
common::Progressive StartParse(common::PauseCallback *pause=0)
开始解析相关PDF页面的布局识别。
AttributeValueType
元素通用布局属性值类型的枚举。
Definition: fs_layoutrecognition.h:1362
枚举值:TbLr(PDF 2.0),表示从上到下的行进方向;从左到右的块进方向。
Definition: fs_layoutrecognition.h:1016
结构元素类型:TH,意为"Table header cell",表示 包含描述表格一行或多行或列的标题文本的表格单元格。
Definition: fs_layoutrecognition.h:166
结构元素类型:RT,意为"Ruby annotation text",表示 放置在假名基础文本旁边的较小尺寸文本。
Definition: fs_layoutrecognition.h:235
值类型:宽字符串。
Definition: fs_layoutrecognition.h:1374
枚举值:Circle,表示空心圆形项目符号。
Definition: fs_layoutrecognition.h:1180
RectF GetBBox() const
获取边界框。
枚举值:Watermark。
Definition: fs_layoutrecognition.h:1344
仅适用于PrintField的属性类型:Desc,表示字段的备用名称, 类似于交互字段的字段字典中TU条目提供的值。
Definition: fs_layoutrecognition.h:827
结构元素类型:TOCI,意为"Table of contents item",表示 目录的单个成员。
Definition: fs_layoutrecognition.h:89
结构元素类型:TFoot,意为"Table footer row group",表示 构成表格页脚的行组。
Definition: fs_layoutrecognition.h:186
FX_INT32 int32
有符号 32 位整数。
Definition: fs_basictypes.h:194
Definition: fs_basictypes.h:449
结构元素类型:Table,表示矩形数据单元格的二维布局, 可能具有复杂的子结构。
Definition: fs_layoutrecognition.h:156
(保留)属性类型:Version,表示布局识别引擎的架构版本。
Definition: fs_layoutrecognition.h:896
结构元素类型:PageObject,表示页面对象元素。
Definition: fs_layoutrecognition.h:298
static AttributeType ParseAttributeType(String type_string)
解析属性类型的字符串表示并获取此属性类型的枚举值。
枚举值:Inline,表示属性Placement/RubyPosition的位置。
Definition: fs_layoutrecognition.h:925
结构元素类型:Div,意为"Division",表示通用的块级元素或 元素组。
Definition: fs_layoutrecognition.h:68
枚举值:Background,表示背景工件。背景工件通常作为显示在其上方或放置在该背景旁边的内容的背景。
Definition: fs_layoutrecognition.h:1338
LRContext & operator=(const LRContext &other)
赋值运算符。
枚举值:After,表示属性BlockAlign的对齐或属性RubyPosition的位置。
Definition: fs_layoutrecognition.h:959
枚举值:Dashed,表示边框是一系列短线段。
Definition: fs_layoutrecognition.h:1046
枚举值:Layout,表示布局工件。纯装饰性的排版或设计元素,如脚注规则或背景屏幕。
Definition: fs_layoutrecognition.h:1326
结构元素类型:Warichu,表示整个割注组合的包装器。
Definition: fs_layoutrecognition.h:244
Definition: fs_layoutrecognition.h:1706
Definition: fs_pdfobject.h:848
结构元素类型:THead,意为"Table header row group",表示 构成表格标题的行组。
Definition: fs_layoutrecognition.h:176
结构元素类型:ShadingContent,表示阴影内容元素。
Definition: fs_layoutrecognition.h:306
枚举值:Groove,表示边框看起来像刻在画布上的沟槽。
Definition: fs_layoutrecognition.h:1067
(保留)属性类型:Direction。
Definition: fs_layoutrecognition.h:884
RectF GetBBox() const
获取边界框。
bool operator==(const LRElement &other) const
等于运算符。
Foxit命名空间。
Definition: fs_taggedpdf.h:27
枚举值:UpperAlpha,表示大写字母(A, B, C, ...)。
Definition: fs_layoutrecognition.h:1210
枚举值:Ridge,表示边框看起来像从画布中凸出(与Groove相反)。
Definition: fs_layoutrecognition.h:1074
int GetGraphicsObjectIndex() const
获取相关图形对象的索引。
字节字符串类
Definition: fx_string.h:317
结构元素类型:H6,表示6级标题。
Definition: fs_layoutrecognition.h:133
结构元素类型:TR,意为"Table row",表示 表格中的标题或数据行。
Definition: fs_layoutrecognition.h:161
枚举值:Footer。
Definition: fs_layoutrecognition.h:1342
属性类型:TextAlign,表示BLSE行内文本和其他内容的对齐方式。
Definition: fs_layoutrecognition.h:622
枚举值:Hidden,与None相同,除了在表格元素的边框冲突解决方面。
Definition: fs_layoutrecognition.h:1032
枚举值:Underline,表示文本下方的线条。
Definition: fs_layoutrecognition.h:1150
结构元素类型:H,意为"Heading",表示文档内容细分的标签。 它应该是它所引导的划分的第一个子元素。
Definition: fs_layoutrecognition.h:121
结构元素类型:PathObject,表示路径图形对象元素。
Definition: fs_layoutrecognition.h:286
枚举值:Center,表示属性TextAlign/InlineAlign/RubyAlign的对齐。
Definition: fs_layoutrecognition.h:1124
属性类型:Padding,指定用于元素内容矩形与周围边框之间分离的偏移。
Definition: fs_layoutrecognition.h:572
枚举值:off,表示状态为关闭。
Definition: fs_layoutrecognition.h:1266
ARGB GetAttributeValueARGB(AttributeType type, int index)
获取指定属性类型的ARGB值(由索引指定)。
bool IsGraphicsObjectElement() const
检查当前对象是否为图形对象元素。
值类型:浮点数。
Definition: fs_layoutrecognition.h:1370
AttributeType GetSupportedAttribute(int index)
通过索引获取支持的属性类型。
LRStructureElement GetParentElement() const
获取父元素。
bool IsContentElement() const
检查当前对象是否为内容元素。
结构元素类型:Ruby,表示整个假名注音组合的包装器。
Definition: fs_layoutrecognition.h:225
结构元素类型:H1,表示1级标题。
Definition: fs_layoutrecognition.h:123
Definition: fs_layoutrecognition.h:1774
值类型:32位有符号整数。
Definition: fs_layoutrecognition.h:1368
#define NULL
空指针值。
Definition: fx_system.h:792
枚举值:Outset,表示边框使整个框看起来像从画布中凸出(与Inset相反)。
Definition: fs_layoutrecognition.h:1088
属性类型:GlyphOrientationVertical,指定当内联进展方向为从上到下或从下到上时字形的方向。
Definition: fs_layoutrecognition.h:746
Definition: fx_coordinates.h:1076
LRGraphicsObjectElement GetParentGraphicsObjectElement() const
获取父图形对象元素。
结构元素类型:FormObject,表示表单XObject图形对象元素。
Definition: fs_layoutrecognition.h:292
结构元素类型:ImageObject,表示图像图形对象元素。
Definition: fs_layoutrecognition.h:288
Definition: fs_layoutrecognition.h:423
枚举值:End,表示属性Placement的位置,或属性TextAlign/InlineAlign/RubyAlign的对齐。
Definition: fs_layoutrecognition.h:991
结构元素类型:WP,意为"Warichu punctuation",表示 围绕WT文本的标点符号。
Definition: fs_layoutrecognition.h:254
结构元素类型:Note,表示解释性文本项, 如脚注或尾注,在文档正文中被引用。
Definition: fs_layoutrecognition.h:201
结构元素类型:Document,表示完整的文档。
Definition: fs_layoutrecognition.h:49
(保留)属性类型:ABox。
Definition: fs_layoutrecognition.h:890
LRStructureElement GetAttributeValueElement(AttributeType type, int index)
获取指定属性类型的结构元素对象(由索引指定)。
枚举值:Solid,表示边框是单一线段。
Definition: fs_layoutrecognition.h:1053
属性类型:TextDecorationType,表示应用于元素文本的文本装饰(如果有的话)。
Definition: fs_layoutrecognition.h:713
枚举值:Column,表示表格的列。
Definition: fs_layoutrecognition.h:1284
结构元素类型:Quote,意为"Quotation",表示 归属于周围文本作者以外的人的内联文本部分。
Definition: fs_layoutrecognition.h:196
仅适用于Table的属性类型:ColSpan,表示单元格跨越的封闭表格中的列数。
Definition: fs_layoutrecognition.h:839
结构元素类型:RP,意为"Ruby punctuation",表示 围绕假名注音文本的标点符号。
Definition: fs_layoutrecognition.h:240
ElementType
标准结构类型的枚举。
Definition: fs_layoutrecognition.h:47
枚举值:pb,表示按钮。
Definition: fs_layoutrecognition.h:1248
结构元素类型:Reference,表示对文档中 其他地方内容的引用。
Definition: fs_layoutrecognition.h:206
属性类型:StartIndent,表示从参考区域的开始边缘到BLSE开始边缘的距离。
Definition: fs_layoutrecognition.h:596
结构元素类型:Index,表示包含识别文本的条目序列, 伴随指向文档主体中指定文本出现位置的引用元素。
Definition: fs_layoutrecognition.h:94
LRContext(const pdf::PDFPage &page)
构造函数,基于PDF页面对象。
值类型:ARGB值数组。
Definition: fs_layoutrecognition.h:1384
Definition: fs_layoutrecognition.h:1095
值类型:整数值数组。
Definition: fs_layoutrecognition.h:1380
Definition: fs_layoutrecognition.h:39
结构元素类型:Part,表示文档的大规模划分。
Definition: fs_layoutrecognition.h:53
属性类型:BorderStyle,表示元素边框的样式。
Definition: fs_layoutrecognition.h:527
值类型:元素数组。
Definition: fs_layoutrecognition.h:1388
枚举值:UpperRoman,表示大写罗马数字(I, II, III, IV, ...)。
Definition: fs_layoutrecognition.h:1198
属性类型:LineHeight,表示元素在块进展方向上的首选高度。
Definition: fs_layoutrecognition.h:688
枚举值:Distribute,表示内容要在行进方向上扩展以填充可用宽度。
Definition: fs_layoutrecognition.h:1168
属性类型:BackgroundColor,表示用于填充表格单元格或任何元素内容矩形背景的颜色。
Definition: fs_layoutrecognition.h:502
String StringifyType() const
将当前元素的类型(枚举值)转换为简短且易记的字符串(文本)表示。
枚举值:LowerRoman,表示小写罗马数字(i, ii, iii, iv, ...)。
Definition: fs_layoutrecognition.h:1204
Definition: fx_coordinates.h:771
属性类型:Short(PDF 2.0),包含TH结构元素内容的简短形式。
Definition: fs_layoutrecognition.h:871
属性类型:BaselineShift,表示元素基线相对于其父元素基线的偏移距离。
Definition: fs_layoutrecognition.h:678
枚举值:Bates(PDF2.0)。
Definition: fs_layoutrecognition.h:1348
pdf::graphics::GraphicsObject * GetGraphicsObject() const
获取相关的图形对象。
结构元素类型:LI,意为"List item",表示列表的单个成员。
Definition: fs_layoutrecognition.h:141
bool operator!=(const LRContext &other) const
不等于运算符。
枚举值:cb,表示复选框。
Definition: fs_layoutrecognition.h:1242