2017-11-06

Instaparseでパーサジェネレータ

プログラミング Clojure

Instaparseの位置づけ

InstaparseはClojure言語によるパーサジェネレータ - Wikipedia である

github.com

これのルール記述はBNFの拡張であるEBNFが使われている。

EBNFで構造化言語のルールを記述する

さっそくだが、「＜p＞sample＜/p＞」を読み取るBNFのルールを書いてみた。とは言え、HTMLの複雑なルールを最初から書くのは無理なので、とりあえずタグの開始と終了を読み取れるものを作る。

しかもこのルール記述、de.setf.xml/html-grammar.bnf at master · lisp/de.setf.xml · GitHub からコピーしてきたものである。

コードサンプル

(ns sample
  (:require [instaparse.core :as insta]))

;;
;; https://github.com/lisp/de.setf.xml/blob/master/bnf/html-grammar.bnf
;;
(def as-and-bs
  (insta/parser
   "HtmlDocument ::= Root
    Root         ::= ElementHtml
    ElementHtml  ::= HtmlTag | ( STag ( '/>' | ( '>' #'\\w'++ ETag ) ) )
    HtmlTag      ::= '<'  #'\\w'++ S* '>'
    STag         ::= '<'  #'\\w'++ S*
    ETag         ::= '</' #'\\w'++ S* '>'

    S ::= (' ' | '\t' | '\r\n' | '\n')+
"))

(def fool-tags "<p>sample</p>")

(defn fool-sample []
  (println (as-and-bs fool-tags)))

出力

sampleのデータがきっちり構造化されて戻ってきた

lein test html-template.test
[:HtmlDocument [:Root [:ElementHtml [:STag < p] > s a m p l e [:ETag </ p >]]]]

後はこれに対して指定されたキーを使ってデータを取得したりすればいいのである。

2017-07-26

AOJ - ALDS1_7_A, B, C (木構造) を解いてみた

AOJ プログラミング Ruby 競技プログラミング

勝手に解いてろとか言わないで…

木構造を使うときの基本
ALDS1_7_A - 根付き木
- get_depth ( id, nodes )
- get_children ( id, nodes )
ALDS1_7_B - 二分木
ALDS1_7_C - 木の巡回
使用例？

ALDS1_7_A, B, Cは、木構造（根付き木、二分木）です

木構造を使うときの基本

まあ、木構造単体でプログラミングコンテストの問題が出されることはほとんど無さそうなのですが…*1

とりあえず、構造体 or クラスで以下のような型を作る
木構造の１要素を１つのNodeというクラスで表現します。中には親要素のid、左と右の要素のidを持ちます。
Rubyの場合はStructを使うと楽にそういうのが作れる、Generics無しにそれを配列型にできるし

Node = Struct.new(:parent, :left, :right)
nodes = Array.new(N) { Node.new }

ALDS1_7_A - 根付き木

１つの節（ノード）に複数の子がくっつく場合の構造。

自分の回答

用意した関数を紹介しておく

get_depth ( id, nodes )

その接点の深さを求める

get_children ( id, nodes )

その接点の直下の子ノードを求める

ALDS1_7_B - 二分木

１つの節（ノード）に２つの子しかつかない場合の構造。

自分の回答

用意した関数を紹介しておく

get_depth ( id, nodes )

その接点の深さを求める

get_height ( id, nodes )

その接点の高さを求める、深さと逆のため再帰的にノードを求める必要がある(Finding height in Binary Search Tree - Stack Overflow)

get_sibling ( id, nodes )

その接点と同じ階層にあるノードを求める、二分木の場合隣接するものはあるかないか２択になる

ALDS1_7_C - 木の巡回

木の巡回には３種類あるという話。

根節点、左部分木、右部分木の順で節点の番号を出力する。これを木の先行順巡回 (preorder tree walk) と呼びます。
左部分木、根節点、右部分木の順で節点の番号を出力する。これを木の中間順巡回 (inorder tree walk) と呼びます。
左部分木、右部分木、根節点の順で節点の番号を出力する。これを木の後行順巡回 (postorder tree walk) と呼びます。

自分の回答

用意した関数を紹介しておく

pre_parse ( root, nodes )

根節点、左部分木、右部分木の順で節点の番号を出力する

in_parse ( root, nodes )

左部分木、根節点、右部分木の順で節点の番号を出力する

post_parse ( root, nodes )

左部分木、右部分木、根節点の順で節点の番号を出力する

使用例？

単純な木構造って、実務でも競プロでも使うことが稀な気がする。すごい単純なデータが問題で、なおかつ階層がキーになる場合に使えばいいのかな？いい問題があれば追記します。

追記：　木構造の問題です

A Rational Sequence 2 – Kattis, Kattis

*1:木構造よりも、それの発展系のグラフアルゴリズムの出題が多そう

2017-07-06

アルゴリズム学びフローを作成してみる

AOJ プログラミング競技プログラミング

AOJの本

AOJの本

この本を買ってみた。プログラミングコンテスト攻略のためのアルゴリズムとデータ構造…

プログラミングコンテスト攻略のためのアルゴリズムとデータ構造

作者: 渡部有隆,Ozy(協力),秋葉拓哉(協力)
出版社/メーカー: マイナビ
発売日: 2015/01/30
メディア: 単行本（ソフトカバー）
この商品を含むブログ (6件) を見る

本の内容とレビュー

知識ゼロからはじめてもわかるように、アルゴリズムがだいたい順番に問題とともに紹介されている。昔paizaでA問題が解けないと悩んでいたが、それはこの本に載っているような、計算量を減らすためのアルゴリズムが組めていないことが原因であったと思う。

書籍の中ではAOJの例題が一緒に載っているので、文章を読んで理解した後に問題を実際に解いて腕試しすることができる。

見通しを立ててみる

書籍の中では、「このアルゴリズムを学んだら、次はこれに進めます」という情報が書いてある。ちょっとその情報をdraw.ioというサービスで絵にしてみた。（こういう風に、構造化していけば雑然とした概念がまとまるかなあという願望…）

図を書いていて思ったこと。

業務プログラミングでは、緑の線を出るか出ないかぐらいの知識しか使わない
自分は木構造とグラフと動的計画法の知識が足りない感じなので、そこをマスターしていく必要がある

高解像度版

f:id:panzer-jagdironscrap1:20170706000220p:plain

プロコンで解いた問題を格納

今日は何か新しいことをやる気力が無くなったので、今まで解いた問題のコードを格納するリポジトリを作ってみた

github.com

なんとな～くしあわせ？の日記

「そしてそれゆえ、知識そのものが力である」 (Nam et ipsa scientia potestas est.) 〜フランシス・ベーコン

Instaparseでパーサジェネレータ

Instaparseの位置づけ

EBNFで構造化言語のルールを記述する

コードサンプル

出力

AOJ - ALDS1_7_A, B, C (木構造) を解いてみた

木構造を使うときの基本

ALDS1_7_A - 根付き木

get_depth ( id, nodes )

get_children ( id, nodes )

ALDS1_7_B - 二分木

get_depth ( id, nodes )

get_height ( id, nodes )

get_sibling ( id, nodes )

ALDS1_7_C - 木の巡回

pre_parse ( root, nodes )

in_parse ( root, nodes )

post_parse ( root, nodes )

使用例？

アルゴリズム学びフローを作成してみる

AOJの本

本の内容とレビュー

見通しを立ててみる

プロコンで解いた問題を格納