Landscape トップページ | < 前の日 2005-10-24 2005-10-25 次の日 2005-10-26 >

Landscape - エンジニアのメモ 2005-10-25

一定以上のサイズを持つファイルを gzip 圧縮するシェルスクリプト


* 一定以上のサイズを持つファイルを gzip 圧縮するシェルスクリプト

この記事の直リンクURL: Permlink | この記事が属するカテゴリ: [シェルスクリプト]

一定の値以上のサイズを持つファイルを gzip 圧縮するシェルスクリプト。

どんなときに使うかというと、サイズの大きい html や xml をあらかじめ圧縮しておき、HTTP リクエストヘッダ Accept-Encoding: gzip を送ってきているクライアントには圧縮済みファイルを返す、ということをやりたいとき。以下の記事参照。

2005-09-14 「Content Negotiation でリクエストに応じて gzip 圧縮ファイルを返す」
2005-09-15 「mod_rewrite でリクエストに応じて gzip 圧縮ファイルを返す」

当サイト Landscape を置いているサーバ環境では mod_gzip が使えず、圧縮するには CGI でやるか、あらかじめ静的なgzip 圧縮ファイルを用意しておくことが必要。

- 一定の値以上のサイズを持つファイルを gzip 圧縮するシェルスクリプト

html を生成したあとに以下のスクリプトで圧縮している。

#!/bin/sh
compress_target=`find $HOME/public_html/log.sonic64 -maxdepth 1 -size +200k ! -name '*.gz'`
compress_target="$compress_target `find $HOME/public_html/log.sonic64 -maxdepth 1 -name 'index.html' -or -name 'cl.xml'`"

for file in $compress_target; do
  echo "compressing $file"
  gzip -9 -c $file >$file.gz
  touch -r $file $file.gz
  chmod 604 $file.gz
done

圧縮対象ファイルの条件は、ファイルサイズが 200 KB 以上で、かつファイル名の末尾が .gz でないもの。さらに、それに加えて index.html と cl.xml は無条件に圧縮対象としている。2回 find を実行している理由は、複数の条件を書いて一回の find にまとめようとしたけど意図したように動かなかったため。こういう仕事を楽にするためのスクリプトは、無駄なく書くことよりも速攻で書いて動かす方が重要だから妥協した。

で、条件に合致するファイルをリストにした後は一つずつ gzip -9 で圧縮し、touch でもとのファイルとタイムスタンプを一致させ、chmod でパーミッションを整えてる。umask でもいいんだけど、明示的にやりたかったので chmod してる。

すべての記事の見出し (全1029件)
全カテゴリの一覧と記事の数
カテゴリごとに記事をまとめ読みできます。記事の表題だけを見たい場合は、すべての記事の見出し (カテゴリ別表示) へ。

直近30日分の記事
2007-04-23 (Mon)
2007-03-07 (Wed)
2007-02-27 (Tue)
2007-01-17 (Wed)
2007-01-15 (Mon)
2007-01-14 (Sun)
2007-01-08 (Mon)
2006-12-01 (Fri)
2006-11-22 (Wed)
2006-11-20 (Mon)
2006-11-19 (Sun)
2006-09-30 (Sat)
2006-08-29 (Tue)
2006-08-04 (Fri)
2006-07-27 (Thu)
2006-07-23 (Sun)
2006-07-17 (Mon)
2006-07-10 (Mon)
2006-07-06 (Thu)
2006-07-03 (Mon)
2006-06-29 (Thu)
2006-06-28 (Wed)
2006-06-27 (Tue)
2006-06-25 (Sun)
2006-06-19 (Mon)
2006-06-18 (Sun)
2006-06-15 (Thu)
2006-06-11 (Sun)
2006-06-01 (Thu)
2006-05-30 (Tue)
プロファイル
斎藤 宏明。エンジニアです。宇都宮市に住んでいます。
リンク
RSS
スポンサードリンク
Powered by
さくらインターネット

© 斎藤 宏明 Saito Hiroaki Gmail Address
Landscape - エンジニアのメモ http://sonic64.com/
Landscape はランドスケープと読みます。
ひらがなだと らんどすけーぷ です。