Avor数据排序顺序
发布时间:
2022-05-17 15:27:29
Avor数据排序顺序,对象化前景常使用的操作就是排序,在Avro确定了数据标准排列顺序以后,就允许系统写入的数据被另外的系统高效地排序了,这是个很重要的优化。即使Avro二进制数据还没有反序列化对象,也可以对其进行高效排序。
要对拥有相同模式的数据项进行比较,可以采用对模式的深度优先、从左到右递归遍历的方式。遇到不能匹配的项即按原来顺序,比如,boolean类型的数据和int类型的数据不能匹配,因此就不用进行排序。具体来说,相同模式的两个项进行比较时需遵从以下规则。
① null数据总是相等的。
② boolean类型中false排在true的前面。
③ int、long、float与double数据按照数值的升序排列。
④ bytes和fixed数据根据8位无符号值按照字节序进行比较。
⑤ string数据根据Unicode按字节进行比较,值得注意的是,对字符串而言,既然UTF-8作为二进制编码使用,那么按字节排序和按字符串二进制数据排序是相同的。
⑥ array数据根据元素按字节序进行比较。
⑦ enum数据根据枚举模式中符号的位置进行排序。例如,枚举的符号位["z","a"]把"z"排在"a"前面。
⑧ union数据先按照联合的分支进行排序,接着按照分支的类型排序。例如,联合["int","string"]中,所有整型将排在所有字符型值前,而整型和字符型各自按照上面的规则排序。
⑨ record数据根据字段按字节序排序。如果字段指定顺序为:
● "ascending":其值排序的顺序不变;
● "descending":其值排序的顺序反转;
● "ignore":排序时其值将被忽略。⑩ map数据不进行比较。试图比较包含映射的数据是非法的,除非映射是“有序”的,否则“忽略”记录字段。
上一篇:
虚拟化技术分类有哪些
下一篇:
谱聚类算法