重複ファイルのハードリンク化

これまでは、重複ファイルは手で消すか、めちゃめちゃAdHockなスクリプトで消したりしてましたが、限界を感じてました。ていうか、もう重複が生じるのを防ぐのはムリ。全部残します。

ということで、この辺( http://www.sfc.wide.ad.jp/~irino/blog/2009/05/freedup.php )を参考にFreeDupを導入。重複ファイルを見つけてきて、ハードリンク化してくれるソフトだそうです。ただしハードリンクを使う都合上、同一ボリューム内にしか適用できないとのこと。実はいうと今日までハードリンクの意味をちゃんと理解してませんでした。ハードリンクは新しく作成したリンクも元のファイルと同じinodeを指すようになるんですね。うちの環境では複数のディスクをLVMで大きなボリュームに見せかけているので、正しく私のためにあるようなソフトかも。

というわけで導入しましたが、この前 rpmforge のリポジトリを入れたからか、CentOS 5.3 には yum ですんなり入りました。で、使ってみると500Gも空きました。もうどんだけだよ、、、、

で重複ファイルは消えちゃうのでバックアップは別ボリュームということに。rsync に-Lオプションをつけてコピーすれば(リンク元とリンク先の両方があれば)ちゃんとハードリンクとして扱ってくれるとのこと。
http://www.infoscience.co.jp/technical/rsync/rsync.html