tw.log

https://twitter.com/kinaba のログ (twilog の方が便利です。)

<<newer (latest) older>>

20170213 13:15 @kinaba これ文字通りにやるのは無理な気がしてきた。(c1|c2|...|c8)* は所詮正規言語なので曖昧性と言っても8状態空間有限通りにしかとれないのでpumping lemmaとかと同じで括弧の個数まで覚えきれない。ネストのたびに符号語空間変えるのは面白くないしなあ
20170213 17:28 @saito_ta はい、そっちの方向(言語的には一意な構文解析の保証がないのでプログラマがそれを避けるように頑張らないといけない(曖昧なのはコンパイルエラー))で面白くするしかないかなあと思っていたところでした。
20170213 21:48 https://t.co/15q0PoSWmX 読んでた。接頭符号になってない(ある文字の符号が別の文字のprefixになってる)符号化はデコードが一意にならないことがあったり困り物…と見せかけて、特定の文字の並びが絶対に来ないなどの場合に敢えてこいつを使って圧縮率限界突破する話
20170213 21:51 いや、なんかtokenがprefix条件満たさないせいで字句解析が不可解なことになるプログラミング言語とか作ってみたくなったので、non-prefix codeの面白い話とかないかなーと調べてたらこれに限らずちょこちょこ色んな研究あって面白いな。
20170213 21:53 あとC++のtemplateやJavaのGenericsの閉じ括弧連打と右シフトが混ざる問題、これ現実の言語では構文解析側のハックで直しちゃってるけど本来はprefix符号でないtokenの例だよな、現実は余裕で先を行っていた、とかいうことを考えていた

<<newer (latest) older>>

presented by k.inaba (kiki .a.t. kmonos.net) under CC0