読者です 読者をやめる 読者になる 読者になる

あったこといろいろ

ほぼ自分用備忘録です。

AtCoder上で過去に提出したソースコードをローカルに保存する

この記事は、Competitive Programming Advent Calendar 2016(その2)の9日目の記事です。


ACしたソースコードは削除してしまう運用をしていましたが、ふと過去に提出したソースコードをローカルに保存したくなったので、プログラムを書きました。
同じ気持ちになった人は是非ご利用下さい。


以下プログラムの簡単な仕様です

  • 本プログラムを実行した階層に、「(コンテスト名)-(問題ID)_(submitID).cpp」という名称のファイルが大量に作成されます。(例:"abc001-A_582728.cpp")
  • 「ME='Yazaten'」という文のYazatenを自分のAtCoder IDに変更して使用して下さい。
  • ABC,ARC以外のコンテストに提出したソースコードについては対応していません。
  • およそ1秒あたり1ソースコードを取得する設計になっているので、「保存するソースコード数 * 1秒」以上の実行時間がかかります。

著作権の話

ソースコード著作権が少し気になってAtCoderの規約と著作権法を雑に読みました。

結論だけ話すと、自分のソースコードを取得することは問題無さそうです。
他人のソースコードを取得することが違法かどうかはよくわからない*1ので、非推奨としておきます。
( 間違っていればご指摘いただけるとありがたいです )

ソースコード

  • 本プログラムはpythonで書かれています。
  • python 2.7.9で動作することを確認しています。
  • 適当に書いたので冗長かもしれませんが、ご容赦ください。
  • skht777さんの作成したAPI( 元プログラムの作者はYSRKENさん? )を利用しています。


参考文献


明日、10日目の記事の担当は nanTosaka2 さんと ark_golgo さんです。

*1:著作権物の複製にあたるかもしれない

色々なアルゴリズムで「殴る」

この記事は、Competitive Programming Advent Calendar 2016 の7日目の記事です。


あなたは、一部の競プロ勢の間で使われている「セグ木で殴る」という言葉をご存知でしょうか?

priority_queueを使えば良いところをセグ木で解いてみたり*1、累積和を使えば良いところをセグ木で解いてみたり*2するアレです。

この「セグ木で殴る」は、「考察すればもっとスマートに書けるがめんどくさいのでセグ木で解いた」といった意味であり、ややネガティブな言葉でもあります*3
しかし競技プログラミングに限定すれば、バグさえ出さなければスマートに書く必要はありません。速さが正義です。
そこで本記事では、セグ木以外での「殴り方」をいくつか紹介したいと思います。

強連結成分分解で「殴る」

強連結成分分解は蟻本にも載っているアルゴリズムで、有向グラフ上の強連結成分を圧縮してDAGにするアルゴリズムです(ざっくり)。
知名度はそれなりですが、使う機会はあまり多くありません*4


早速殴っていきましょう。
今回、この強連結成分分解で殴られる問題はこちらです。(問題のネタバレを含みます)
abc030.contest.atcoder.jp


この問題を説く過程では、頂点をたどることによってたどり着く閉路に含まれる頂点数を求める処理が必要になる場面があります。
f:id:Yazaten:20161207125512p:plain

スマートに実装するならば「有向グラフを1頂点づつたどってゆき、usedの頂点とぶつかったときの深さ - usedの頂点の深さ が閉路の大きさ が答え」みたいな感じで求める方法が考えられます。
しかし、このアルゴリズムを考えるのが面倒だったり*5バグが怖いので書きたくないという気持ちになるかもしれません。

そこで、強連結成分分解で殴ってみることにしましょう。


強連結成分分解を適用する過程で、ある頂点を含む強連結成分の大きさ をO(1)で知ることができる配列を得ることができます。
そこで、「頂点をたどっていき今いる頂点を含む強連結成分の大きさを調べる。大きさが2以上であればそこが最終的にたどり着く閉路であり、その大きさは前述の配列を使って容易に求まる。」といった手順で目的の処理を実現することができます。


実際に強連結成分分解で解いたソースコードへのリンクを以下に貼っておきます。
Submission #961082 - AtCoder Beginner Contest 030 | AtCoder


二重辺連結成分分解で殴る

二重辺連結成分分解は蟻本には載っていませんが、僕の記事を初めいくつかの解説記事があります。無向グラフ上の二重辺連結成分を圧縮するアルゴリズムです(ざっくり)。知名度は強連結成分分解以上に低く、使う機会はかなり少ないです*6

どんどん殴っていきましょう。
今回、この二重辺連結成分分解で殴られる問題はこちらです。(問題のネタバレを含みます)
utpc2014.contest.atcoder.jp


この問題を解く過程で、N頂点N辺の連結なグラフ*7の持つ閉路に含まれる頂点数を求める処理が必要になる場面があります。
f:id:Yazaten:20161207125524p:plain

スマートに実装するならば「根つき木にして深さを持ったDFSをし、usedの頂点にぶつかった時の深さ - usedの頂点の深さが閉路の大きさ が答え」みたいな感じで求める方法が考えられます。

しかしここでは二重辺連結成分分解で殴ってみることにしましょう。


二重辺連結成分分解を適用する過程で、各二重辺連結成分に含まれる頂点の数とその要素を得ることができます。
N頂点N辺の連結なグラフはちょうど1つの閉路を持ち、閉路は二重辺連結成分の一種です。
そのため、「頂点数 = 辺数 かつ 連結な有向グラフ」に1つだけ含まれる閉路のサイズを容易に知ることができます。


実際に二重辺連結成分分解で解いたソースコードへのリンクを以下に貼っておきます。
Submission #1015041 - 東京大学プログラミングコンテスト2014 | AtCoder


「殴る」ことによるメリット・デメリット

メリット

  • ライブラリを貼るだけで良いので実装量が減る
  • Twitterで「C問題は◯◯で殴った」とか言える

デメリット

  • 可読性が低くなる
  • ソースコード長が無駄に長くなる(冗長な部分が増える)
  • 計算量が増加する場合がある

まとめ

競技プログラミングでこういうことをすると微妙な顔をされてしまう可能性があります。用法用量を守って正しくご使用下さい。


明日、8日目の記事はskyaozoraさんの「競プロを初めて10年になるので振り返ります」とyosupotさんの記事(内緒と書いてあった…)です。

*1:ワカサギ釣り | Aizu Online Judge

*2:B: ドキドキデート大作戦高橋君 - AtCoder Regular Contest 045 | AtCoder

*3:個人の感想です

*4:個人の感想です

*5:プロなら一瞬で思いつくぞー!という指摘は恐らく正しいです。

*6:個人の感想です

*7:なもりグラフやよすぽグラフとも呼ばれる。木に辺を一本追加したグラフであり、ちょうど1つの閉路を必ず含む。

橋・二重辺連結成分分解

この記事は、Competitive Programming Advent Calendar 2016の記事……ではなく、僕のAdCの記事を楽しむための予備知識として書かれた記事です。
ちなみに、僕の担当は明後日です。よろしくおねがいします。



グラフ上の「橋*1」となる辺を求め、これによりグラフを複数の「二重辺連結成分*2」に分解する方法を解説します。
補足を注釈に書いていたりするので、適宜参照して下さい。

アルゴリズム

前置き

橋は、imos法を用いた方法*3やlowlinkを使う方法*4で列挙することができ、橋を取り除いたグラフでDFSをすることで二重辺連結成分に分解できます。
一方ここでは、Spaghetti Sourceのコードに基づいた、DFSをしながら橋と二重辺連結成分をまとめて列挙する方法を解説します。

以下の説明では「DFS木」や「後退辺」といった用語の説明は省きます。
その辺りの知識が不安な場合、npcaの部誌(2014)のP25あたりを読むと良いと思います。(ちなみに、この部誌ではlowlinkを使った橋の列挙方法を解説しています。)

解説

与えられたグラフ上の適当な頂点からDFSを行い、DFS木を作成します。
この作業の途中に、辺(u,v)*5を辿った先がusedである場合、この辺は後退辺であり、頂点u〜頂点vは同じ二重辺連結成分であることがわかります*6
この処理をDFSをしながら繰り返すことで、二重辺連結成分を列挙できます。また、二重辺連結成分に含まれていない辺は全て橋となっているため、橋を列挙できます。
f:id:Yazaten:20160726190852p:plain
u(8,5)が後退辺であるため、頂点5,7,8は同じ二重辺連結成分であることがわかります。

実装

アルゴリズム」の章では大まかな動作を解説しました。ここでは、具体的な実装を解説します。

はじめに、使用するデータ構造についての解説を以下に示します。

変数名 説明
vector<int> order 各頂点に訪れた順番
stack<int> S 既に訪れた頂点のうち、まだどの二重辺連結成分にも割り振られていない頂点の集合
vector<bool> inS 集合Sに各頂点が含まれているかどうかの情報
stack<int> roots 各二重辺連結成分を、DFS木の部分木として見た時の根の集合


適当な頂点を根としてDFSを開始します。
以下の解説では、現在訪れている頂点をcurと呼び、一つ前に訪れた頂点をprevと呼びます。

新しい頂点を訪れる度に以下の動作を行います。

  • order[cur]にorder[prev]+1を代入することで、その頂点に訪れた順番を記録
  • 集合Sにcurを追加し、curを追加したことをinSに記録
  • rootsにcurを追加


使おうとした辺(cur,to)が後退辺である場合(つまり「to!=prev && inS[to]」の場合 )、以下の動作を行います。

  • cur〜toまでの頂点(ただしtoは含まない)をrootsから捨てる


roots.top()の頂点より葉側の頂点の訪問が終了した場合(つまり「cur==roots.top()」の場合)、以下の動作を行います。
なお説明のため、roots.top()の頂点を以下ではnodeと呼びます。

  • nodeと、DFS木上でnodeより1つだけ根側にある頂点を橋として記録する(nodeが根である場合はなにもしない)
  • 一度目にnodeに訪問してから、nodeに戻ってくるまでに訪問した頂点をすべて同じ連結成分分解として記録する。(S.top()がnodeで無い間、topの値を記録し続けることで実現できる。)
  • rootsのtopの格納されている頂点をpopする


上記の動作を行うことによって最終的に、bridge関数の引数であるbrgに橋のリストが、each_bccに二重連結成分のリストが、cmpにある頂点がどの二重連結成分に含まれているかの情報が格納される。


*1:グラフから取り除いた時に連結成分が増える辺

*2:任意の辺を取り除いても連結であるような部分グラフ

*3:二重辺連結成分分解 ライブラリ - ゆらのふなびと

*4:二重辺連結成分分解 - コードを短く書く人のブログ

*5:DFS中木上で根に近い方の頂点をvとする

*6:DFS木上の任意の後退辺(u,v)を考えると、vは必ずuの親となります。

ICPC2016アジア地区つくば大会参加記

10/15~16 に行われたICPCつくば大会に、チームmiyazoy72で参加しました。


最終成績は45チーム中42位と、非常に悔しい結果となりました。

チーム練習としては会津さんがvirtual arenaで開いているコンテストに何度か出場していました。
LiveArchiveが壊れていて何を提出してもWAになった回が一番面白かったです。
575.cppはいつも強かったです。

1日目

受付開始30分前頃に会場に到着しました。
受付まではNAISTチーム、電通大チーム、会津大チームの方々とお話をしたりしていました。

周りを見渡すとコンテストの順位表でよく見かける方々ばかりで、このときから既に緊張していました。


プラクティスセッションでは用意していたemacsの設定を記述しましたが、思うように動きませんでした。
余った時間で一人一問を一応AC。
キーボードについては、配列は普段からUSなので問題はなかったものの、少し硬いかなぁという感想でした。
結局僕はあまり実装を担当しなかったので特に問題はありませんでしたが。


会場から筑波大学までは距離があるらしく、バスに乗って移動しました。
歓迎会では他の参加者と交流していました。

ホテルへ移動後は、emacsの設定を調べて、正常に動作する確認をしてすぐ寝ました。


2日目

朝は6時頃に起きました 朝ごはんが美味しかったです。
これはチームメイトとのslackでのやりとりです。
f:id:Yazaten:20161028130849p:plain

会場へはNAISTチームと一緒に移動しました。
会場到着後、コンテスト開始までは特に何もしていませんでした。


コンテスト開始直後はemacs等の設定を記述しました。
前日夜の確認で問題点はわかっていた(フォルダ名を".emacs.d"とするところを".emacs"にしていた)ので気をつけて書きました。
A問題はすぐに書けそうとのことで設定記述中に交代していたので、この時点で1ACでした。

C問題の読解が終わっていたので聞きました。
ある倉庫にたどり着ける荷物の集合は区間で表せることには気づいたのですが、緊張からか考察がなかなか進まず。
嘘解法を noy72 に伝えてしまいWAをもらったりしていました。

ここでB問題が簡単そうと聞きそちらに合流、全探索で適切にやればよさそう。
lazymii に実装をお願いしましたが、サンプルが合わないらしく混乱していたため紙の上で解法を確認。
2時間ほど経ってなんとかAC。時間がかかりすぎてしまった…

C問題は、合流した lazymii が解法を思いついてくれたのでおまかせしました。
A~CまでACするまでに3時間以上かかっており、いつもの調子が出ていないどころの騒ぎじゃないなと思っていました。

ここで選択肢としてはDかEのどちらかを解くというところでしたが、四則演算構文解析やったことなしだったのでDに専念することにしました。
見た瞬間ローリングハッシュだと思ったのですが、多くのチームがWAを出していたり、夏合宿でロリハ問題を軽々とACしていた shora_kujira16 さんのいるチームも手間取っていたため別解法を考えていました。

結局最後まで何も思いつかなかったので、終了間際にハッシュ値を配列に格納しておくO(N^2 logN)のロリハ解をダメ元で提出しました。
配列に格納する都合上MODを10^6にしていたため当然ハッシュが衝突してWAが返ってきました。


冒頭に書いたとおり、結果は 42位 / 45チーム でした。
問題文はほとんどチームメイトが読んでくれたため、その点はほとんど障害になりませんでした。
敗因はハッシュの理解の浅さと緊張だったと思っています。
チームメイトの協力に見合った活躍ができなかった…



コンテスト終了後は、1時間ほど余ったお菓子やドリンクに群がっていました。
コンテストは 8:45~13:45 の5時間開催だったので、とてもお腹が空きました。

その後の懇親会では協賛企業のブースが並んでおり賑やかでした。
司会の方が「あなた方のプログラミングスキルは非常に優秀で…」みたいなことを言っていて、「僕はそうでもないですよ」と思ったりしていました。


解散後は、n_vipさんが主催して下さった二次会に参加しました。
いくつかのチームは海外regionにも参加するらしく、海外チームの話などをしていました。
こういった話はなかなか聞けないので非常に面白かったです。


感想

  • 今まではICPCのアジア地区大会に "進出すること" を1つの目標として競プロを続けて来ましたが、出場チームの人々を見たり会場の空気を感じて、進出は通過点であることを体感しました。
  • ICPCには一応大学の代表として出場しているわけで、悔しいという気持ちとともに恥ずかしいという気持ちになったのが新鮮でした。
  • ICPCに出場できるのは来年で最後になります。NAISTからアジア地区に進出し、今年のNAISTチーム(chasen_no_sato)の取った26位という順位を超えられるよう、今から精進を続けていきます。

ARC056 C問題 部門分け

想定解だと思って書いた解法が、どうやらそうではなかったようなので書きます。

解法

最小カットを使います。

部門を分割することによって幾つかの絆が切られる事を考えると、ある部門を2つに分割するための最小コストは最小カットと等しくなります。

この「2つに分割するための最小コスト」が、部門を1つ増やすことによって得られるスコア K 以上であれば分割を行うとスコアが高くなることがわかります。

このように、部門を最小カットで分割することを繰り返すと最大スコアが得られます。


なお、部門の分割を最小カットで貪欲に切ると良いという証明はできていません。(実験をして大丈夫そうだったので書くと通ってしまいました)(証明は解説を頼ろうと思っていたら全然違う解法が書いてありました)


gist.github.com

ICPCアジア地区つくば大会D問題 「Hidden Anagrams」

※これは参加記ではありません。参加記は別記事で上げます。

問題: AIZU ONLINE JUDGE

問題概要

長さ 4000 以下の S1 と S2 が与えられる。
文字列Sの部分文字列を S' と呼ぶことにする。
「S1' が S2' のアナグラムとなるもの」のうち最長のものの長さを求める。

入力
anagram
grandmother

出力
4

解法

S1とS2のうち短い方の長さをNと呼ぶことにする。
一致判定をする部分文字列の長さLを 1~Nまで変化させながら、各Lにおいて以下の処理を行う。

  • 文字列のアナグラムの一致判定は、文字列を構成する文字のヒストグラムの一致判定と等しいので、部分文字列を長さ26のarrayで表現する。
  • 長さLとなる部分文字列のヒストグラムを記録するmapを用意する。
  • 長さLの、S1の部分文字列ヒストグラムをしゃくとり法の要領で列挙し、mapに記録しておく。
  • この判定によりアナグラムが一致するものが見つかれば、最長の長さの値を更新していく。


空間計算量がO(文字列長)になるので余裕を持って通ります。
mapを使いまわさず、「長さLのヒストグラムは map[L] に格納する」という実装をするとMLEしてしまいました。
つくば会場ではMLが非常に大きかったようなので、本番ではmapを使いまわさなくても通っていたように思います。


gist.github.com

会津合宿2016参加記

9月の17日〜19日に開催された会津合宿2016に参加しました。

会津合宿数日前~前日

🔥🔥🔥大学で一日中作問作業🔥🔥🔥

会津合宿day1

立命館大学セットの作問を担当していました。
講評・解説・入出力ケースは右のリンクから閲覧できます。public - Google ドライブ

会津合宿day2

会津大学セットに参加しました。
Twitterでメンバーを募集していたらctylさんとkazuさんに声をかけていただきました。

コンテスト開始。
A問題がctylさんにより瞬殺されていたがB問題がうまく行っていないらしい。

一方僕はC問題を担当。謎の学園が出てきたが元アニメを知らず悲しかった(あんはぴというらしい)。
曜日ごとに独立だなーと考えて、各曜日においてbitDPした後「i日目にj科目で得られる幸福度の最大値」を求めるDPをする解法を思いつく。
B問題担当のkazuさんとPCを取り合いながら書いたがWA。
しばらくバグが見つからず悩んだが、論理演算のORを"||" ANDを"&&"と書いていた事に気付き修正し提出するとAC。
「bit演算やったことありますか???」という感じ(´・_・`)

Cが通った頃には、BとEが通っていてkazuさんがGを書いているという状態だったので、DとIの概要をctylさんに聞く。

D問題はダイクストラっぽく更新してゴール直前まで行き、ギリギリまで待ってからゴールに渡る解法で解けそうな感じ。

I問題は考察がある程度進んでいて、後は「各頂点から最も遠い頂点までの距離が高速に欲しい」という状態だった。
これ技術奥プログラミングコンテストの不可視境界線では?となったのでcityさんに解法を伝えると良さそうとのこと。

これでDとIの解法が出揃ったが、依然としてGでkazuさんがつらそうにしていた。
この時が一番PCの競争率(?)が高かったように思う。
このときにお菓子を食べに行くと、怒髪先生(ジャッジ側)から「並行して問題解いてるときは一番辛いときだからね。がんばってね。」というありがたいお言葉を頂いた。

その後Iはライブラリを写してもらってすんなりACしたが、DとGはバグが取れずにコンテストが終了してしまった(Gはライブラリが間違っていたらしい)。

コンテスト終了後は駅の方まで移動し懇親会に参加した。
皆で”限界集落”という単語がパワーワードであることに気付きめっちゃ盛り上がった。

会津合宿day3

北海道大学セットに参加しました。
怒髪くんと組みたくなったので探したが遅刻しているらしい。
motiさんに電話をかけてもらってOKの返事をいただく(怒髪先生と連絡をとるのは難易度が高いらしい)。
チームメートがもう一人欲しい気持ちになってTwtterを見ると@tookun_1213さんがメンバーを募集していたのでお誘いした。

問題を各自分担する戦法で僕はA問題を担当。
頑張ってやるだけなのでバグらせないように気をつけながらAC。

実装待ちをしていた怒髪くんがD問題を読んでくれていたので概要を聞く。ありがちだけど時間の制約がデカい。
ライブの開始時刻だけ試すのはすぐ思いついたので累積和+二分探索の方針で実装を固める。
BとCがすんなりACしたようなのでPCを貰って実装を開始する。
場合分けや添字を微妙にミスりながらDをAC。

このあいだに怒髪くんがFの解法を思いついたらしいのでバトンタッチ。
ここでEを読んでいたtookunさんと合流して概要を聞く。
残念ながら僕は何も思いつかなかったが、「意外とゲームはすぐ終了するのでDFSで行けるのでは?」*1という感じと言っていたのでおまかせする。

Gを読む。「角角画伯,かく悩みき」の制約追加版という変わった形式で面白い。
まぁ凸包はするよねみたいなことを話したら、凸多角形の任意の辺を底面とした時の縦横の長さを探索できれば良さそうと教えてもらえた。
キャリパー法で各辺の最遠点が高速に求まる」とか「辺と各点までの横方向の距離は3分探索で求まる」とか話したけれど、「この問題の制約上与えられる多角形の頂点の数はそんなに多くならない」という仮説が出たので時間の都合でそれを実装する…が僕の幾何実装力が低いので途中から怒髪くんに書いてもらう。
どうやら正しかったらしくコンテスト終了6分前にAC。
残り時間でEを書くのは厳しそうだったので、「Gは最悪ケースを作ろうという気持ちになると (多角形の頂点数)≒√(与えられる正方形の数) になりそうだね」みたいな話をしていた。

順位表を見ると、なんとオンラインで2位になっていていた。
普段2位なんて順位は取れないのでチーム戦は偉大だなぁと思った。

おわりに

考察にかなり時間をかけて作った問題が、オンライン参加していたプロによってあっという間に解かれて驚愕した。
去年はそもそもアルゴリズムを知らず考察に携われない問題も多かったが、今年はそういったことは起こらなかったので少し成長を感じた。
チーム戦は最高!組んでくれた方ありがとうございました

*1:行けませんでした