提交 c5d53978 编写于 作者: dengyihao's avatar dengyihao

update fst struct

上级 169d9e17
...@@ -138,13 +138,13 @@ void fstStateSetFinalState(FstState *state, bool yes); ...@@ -138,13 +138,13 @@ void fstStateSetFinalState(FstState *state, bool yes);
bool fstStateIsFinalState(FstState *state); bool fstStateIsFinalState(FstState *state);
void fstStateSetStateNtrans(FstState *state, uint8_t n); void fstStateSetStateNtrans(FstState *state, uint8_t n);
// state_ntrans // state_ntrans
void fstStateStateNtrans(FstState *state); uint8_t fstStateStateNtrans(FstState *state, bool *null);
uint64_t fstStateTotalTransSize(FstState *state, uint64_t version, PackSizes size, uint64_t nTrans); uint64_t fstStateTotalTransSize(FstState *state, uint64_t version, PackSizes size, uint64_t nTrans);
uint64_t fstStateTransIndexSize(FstState *state, uint64_t version, uint64_t nTrans); uint64_t fstStateTransIndexSize(FstState *state, uint64_t version, uint64_t nTrans);
uint64_t fstStateNtransLen(FstState *state); uint64_t fstStateNtransLen(FstState *state);
uint64_t fstStateNtrans(FstState *state); uint64_t fstStateNtrans(FstState *state, FstSlice *slice);
Output fstStateFinalOutput(FstState *state, uint64_t version, FstSlice *date, PackSizes sizes, uint64_t nTrans); Output fstStateFinalOutput(FstState *state, uint64_t version, FstSlice *date, PackSizes sizes, uint64_t nTrans);
uint64_t fstStateFindInput(FstState *state, FstNode *node, uint8_t b); uint64_t fstStateFindInput(FstState *state, FstNode *node, uint8_t b, bool *null);
......
...@@ -281,7 +281,7 @@ CompiledAddr fstStateTransAddr(FstState *s, FstNode *node) { ...@@ -281,7 +281,7 @@ CompiledAddr fstStateTransAddr(FstState *s, FstNode *node) {
- tSizes; - tSizes;
// refactor error logic // refactor error logic
return unpackDelta(slice->data + i, tSizes, node->end); return unpackDelta(slice->data + slice->start + i, tSizes, node->end);
} }
} }
CompiledAddr fstStateTransAddrForAnyTrans(FstState *s, FstNode *node, uint64_t i) { CompiledAddr fstStateTransAddrForAnyTrans(FstState *s, FstNode *node, uint64_t i) {
...@@ -296,7 +296,7 @@ CompiledAddr fstStateTransAddrForAnyTrans(FstState *s, FstNode *node, uint64_t i ...@@ -296,7 +296,7 @@ CompiledAddr fstStateTransAddrForAnyTrans(FstState *s, FstNode *node, uint64_t i
- node->nTrans - node->nTrans
- (i * tSizes) - (i * tSizes)
- tSizes; - tSizes;
return unpackDelta(slice->data + at, tSizes, node->end); return unpackDelta(slice->data + slice->start + at, tSizes, node->end);
} }
// sizes // sizes
...@@ -312,49 +312,137 @@ PackSizes fstStateSizes(FstState *s, FstSlice *slice) { ...@@ -312,49 +312,137 @@ PackSizes fstStateSizes(FstState *s, FstSlice *slice) {
return (PackSizes)(slice->data[slice->start + i]); return (PackSizes)(slice->data[slice->start + i]);
} }
// Output // Output
Output fstStateOutput(FstState *state, FstNode *node) { Output fstStateOutput(FstState *s, FstNode *node) {
assert(s->state == OneTrans);
uint8_t oSizes = FST_GET_OUTPUT_PACK_SIZE(node->sizes);
if (oSizes == 0) {
return 0;
}
FstSlice *slice = &node->data;
uint8_t tSizes = FST_GET_TRANSITION_PACK_SIZE(node->sizes);
uint64_t i = node->start
- fstStateInputLen(s);
- 1
- tSizes
- oSizes;
return unpackUint64(slice->data + slice->start + i, oSizes);
} }
Output fstStateOutputForAnyTrans(FstState *state, FstNode *node, uint64_t i) { Output fstStateOutputForAnyTrans(FstState *s, FstNode *node, uint64_t i) {
return 1; assert(s->state == AnyTrans);
uint8_t oSizes = FST_GET_OUTPUT_PACK_SIZE(node->sizes);
if (oSizes == 0) {
return 0;
}
FstSlice *slice = &node->data;
uint64_t at = node->start
- fstStateNtransLen(s)
- 1 // pack size
- fstStateTotalTransSize(s, node->version, node->sizes, node->nTrans)
- (i * oSizes)
- oSizes;
return unpackUint64(slice->data + slice->start + at, oSizes);
} }
// anyTrans specify function // anyTrans specify function
void fstStateSetFinalState(FstState *state, bool yes) { void fstStateSetFinalState(FstState *s, bool yes) {
assert(s->state == AnyTrans);
if (yes) { s->val |= 0b01000000; }
return; return;
} }
bool fstStateIsFinalState(FstState *state) { bool fstStateIsFinalState(FstState *s) {
return false; assert(s->state == AnyTrans);
return (s->val & 0b01000000) == 0b01000000;
} }
void fstStateSetStateNtrans(FstState *state, uint8_t n) {
void fstStateSetStateNtrans(FstState *s, uint8_t n) {
assert(s->state == AnyTrans);
if (n <= 0b00111111) {
s->val = (s->val & 0b11000000) | n;
}
return; return;
} }
// state_ntrans // state_ntrans
void fstStateStateNtrans(FstState *state) { uint8_t fstStateStateNtrans(FstState *s, bool *null) {
return ; assert(s->state == AnyTrans);
} *null = false;
uint64_t fstStateTotalTransSize(FstState *state, uint64_t version, PackSizes size, uint64_t nTrans) { uint8_t n = s->val & 0b00111111;
return 1;
if (n == 0) {
*null = true; // None
}
return n;
} }
uint64_t fstStateTransIndexSize(FstState *state, uint64_t version, uint64_t nTrans) { uint64_t fstStateTotalTransSize(FstState *s, uint64_t version, PackSizes sizes, uint64_t nTrans) {
if (version >= 2 && nTrans > TRANS_INDEX_THRESHOLD) assert(s->state == AnyTrans);
return 256; uint64_t idxSize = fstStateTransIndexSize(s, version, nTrans);
return 0; return nTrans + (nTrans * FST_GET_TRANSITION_PACK_SIZE(sizes)) + idxSize;
} }
uint64_t fstStateNtransLen(FstState *state) { uint64_t fstStateTransIndexSize(FstState *s, uint64_t version, uint64_t nTrans) {
return 1; assert(s->state == AnyTrans);
return (version >= 2 &&nTrans > TRANS_INDEX_THRESHOLD) ? 256 : 0;
} }
uint64_t fstStateNtrans(FstState *state) { uint64_t fstStateNtransLen(FstState *s) {
return 1; assert(s->state == AnyTrans);
bool null = false;
fstStateStateNtrans(s, &null);
return null == true ? 1 : 0;
}
uint64_t fstStateNtrans(FstState *s, FstSlice *slice) {
bool null = false;
uint8_t n = fstStateStateNtrans(s, &null);
if (null != true) {
return n;
}
n = slice->data[slice->end - 1]; // data[data.len() - 2]
return n == 1 ? 256: n; // // "1" is never a normal legal value here, because if there, // is only 1 transition, then it is encoded in the state byte
} }
Output fstStateFinalOutput(FstState *state, uint64_t version, FstSlice *date, PackSizes sizes, uint64_t nTrans) { Output fstStateFinalOutput(FstState *s, uint64_t version, FstSlice *slice, PackSizes sizes, uint64_t nTrans) {
return 1; uint8_t oSizes = FST_GET_OUTPUT_PACK_SIZE(sizes);
if (oSizes == 0 || !fstStateIsFinalState(s)) {
return 0;
}
uint64_t at = FST_SLICE_LEN(slice)
- 1
- fstStateNtransLen(s)
- fstStateTotalTransSize(s, version, sizes, nTrans)
- (nTrans * oSizes)
- oSizes;
return unpackUint64(slice->data + slice->start + at, (uint8_t)oSizes);
} }
uint64_t fstStateFindInput(FstState *state, FstNode *node, uint8_t b) { uint64_t fstStateFindInput(FstState *s, FstNode *node, uint8_t b, bool *null) {
return 1; assert(s->state == AnyTrans);
FstSlice *slice = &node->data;
if (node->version >= 2 && node->nTrans > TRANS_INDEX_THRESHOLD) {
uint64_t at = node->start
- fstStateNtransLen(s)
- 1 // pack size
- fstStateTransIndexSize(s, node->version, node->nTrans);
uint64_t i = slice->data[slice->start + at + b];
if (i >= node->nTrans) {
*null = true;
}
return i;
} else {
uint64_t start = node->start
- fstStateNtransLen(s)
- 1 // pack size
- node->nTrans;
uint64_t end = start + node->nTrans;
uint64_t len = end - start;
for(int i = 0; i < len; i++) {
uint8_t v = slice->data[slice->start + i];
if (v == b) {
return node->nTrans - i - 1; // bug
}
}
}
} }
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册