blog.rmblankslash.net Open in urlscan Pro
54.199.90.60  Public Scan

URL: https://blog.rmblankslash.net/entry/453836237.html
Submission: On June 13 via api from US — Scanned from JP

Form analysis 1 forms found in the DOM

GET https://blog.rmblankslash.net/search

<form class="search-form" role="search" action="https://blog.rmblankslash.net/search" method="get">
  <input type="text" name="q" class="search-module-input" value="" placeholder="記事を検索" required="">
  <input type="submit" value="検索" class="search-module-button">
</form>

Text Content

読者になる



RM-BLOG


IT系技術職のおっさんがIT技術とかライブとか日常とか雑多に語るブログです。*
本ブログに書かれている内容は個人の意見・感想であり、特定の組織に属するものではありません。/ALL OPINIONS ARE MY OWN.*

2017-10-06


【JAVA】画像ファイルのチェック方法

Java関連

Javaによる、画像ファイルのチェック方法について。

--------------------------------------------------------------------------------




 


「ユーザにファイルをアップロードさせる」ような機能を作る際、
なんでもかんでもアップロードさせるわけにはいかないので、
大抵以下のようなチェック機構が必要になる。

 1. アップロードするファイルが存在するか
 2. アップロードするファイルは機能仕様上許可しているファイルフォーマットか
 3. アップロードするファイル容量は適切か(システム上制限しているアップロードファイル容量以下か)

とか。

うち、2.については、
例えば、アップロードするファイルを「画像ファイル」と決めている場合は、
「指定されたファイルは本当に画像ファイルか?」
というのをチェックしたい(チェックしなくてはならない)わけである。
経験上、こういうチェックをするにあたっては、たいてい、
「ファイルの拡張子が画像ファイルのものになっているか?」というのが、
簡易的に実施できるということもあってよくチェック方法として採用される。
Javaで実装するとなると以下のような感じか。

	private static boolean isImageFileByExpression(File file) {
		
		if (file != null && file.isFile()) {
			String filename = file.getName();
			String filenameUppered = filename.toUpperCase();
			if (filenameUppered.endsWith(".JPG")
				|| filenameUppered.endsWith(".JEPG")
				|| filenameUppered.endsWith(".PNG")
				|| filenameUppered.endsWith(".GIF")
				|| filenameUppered.endsWith(".BMP")
				|| filenameUppered.endsWith(".TIFF")
			) {
				return true;
			} else {
				return false;
			}
		} else {
			return false;
		}
	}



ファイル名としては拡張子の英字小文字大文字は別物になる(「A.gif」と「A.GIF」で別のファイルになる)ので、
一旦全部大文字にして判定を行うようにする。(別に小文字でもいいけど)
「画像」としての拡張子の種類は他にもある(TIFFとかも?)のでその分だけ列挙する必要があるが、
数が多くなるようなら外だしのプロパティファイルとかにして、そこと照合させるようなつくりにしたほうがいいのだろう。。

--------------------------------------------------------------------------------



大体は↑にあげた拡張子でチェック可能だろうが、ファイルの拡張子というのは、
しょせん「ファイル名の末尾の最後の"."からの文字列」にすぎず、いくらでも自由に加工できる。
極端な話、

 * 中身はテキストファイルなんだけど拡張子だけ「JPG」
 * 中身は画像ファイルなんだけど拡張子だけ「CSV」

とかいうことも全然可能なわけである。
(まあ一般人でそんなことするやつほとんどいないだろうが……)
このようなケースだと拡張子のチェックをするだけではそのファイルが画像かどうかの切り分けが付かない。
ので、そういう場合にどうするか?

Javaには画像ファイルを取りあつかうクラスがあり、
それで画像ファイル以外を読み込むと、得られる結果がnullになる。
これを使うことで画像かどうかの切り分けが可能となる。

	private static boolean isImageFileByImageIO(File file) throws Throwable {
		if (file != null && file.isFile()) {
			BufferedImage bi = ImageIO.read(file);
			if (bi != null) {
				return true;
			} else {
				return false;
			}
		} else {
			return false;
		}
	}



実装にあたってはjavax.imageio.ImageIOのインポートが必要である。
ImageIO#readにFileを渡すと、java.awt.image.BufferedImageが得られるが、
引数に渡したFileが画像ファイル以外の場合、このBufferedImageがnullになってかえってくる。
これを利用し、「nullだったら画像じゃない!」と判断するのである。(逆にnullでなければ画像と見做してよい)
BufferedImageには縦・横のサイズを取得するメソッドもあるので、
アップロードした画像ファイルを適切な場所に当てはめるようなとき、
当てはめる先の縦横サイズが一致しているかどうかというチェックも可能である。

しかし、ぶっちゃけると、これがどういう原理で画像読込を実現しているかははっきりとわからないので、
「こういうことやると画像かどうかの判定ができる」ということがわかっているだけである。
API見るといろいろ書いてあるが、
ImageIO#readの目的はあくまで画像の読み込みであり、処理内で「読み込めそうなReaderを探す」というのがまず最初にあり、
「読み込めそうなReaderがない」ということから結果的にnullがかえってくる、というのがその実のようだ。
なので(当たり前だが)nullかどうかで判定できるのは「読み込む」という流れから生まれた副産物に過ぎない、
というのは一応意識しておかないといけない。

そもそもファイルというのはテキストだろうが画像だろうが音楽だろうが動画だろうが、
全てバイナリ(バイトコード値)で書かれたものなので、
俺が知らないだけで、テキストでいう文字コードのようなものと同様、画像にも、
「画像自体を表すバイトコード値をもとにそれぞれの画像表示に即した形でエンコード(フォーマット)する方式」が多分、あるんだろうな。
その辺の判定と、判定結果に基づき適切なReaderを使って画像を読み込む処理を、
ImageIO#readが実施しているんだろうな~となんとなく予想している。

--------------------------------------------------------------------------------



ちなみに↑にあげた2つのロジックで下記にあるファイル群をチェックすると、
チェック結果は以下の通りになる。

Noファイル名ファイルの実態内容isImageFileByExpression
(ファイルの拡張子でチェック)の結果isImageFileByImageIO
(ImageIOでのチェック)の結果

1 IMG_0557.JPG.txt 画像 「IMG_0557.JPG」という画像ファイルの末尾に「.txt」を無理やりつけたもの。
ファイル名を変えただけだから実態は写真。 画像ではない 画像である 2 test.txt.bmp 0バイトファイル
中身空っぽの0バイトファイルをこういう名前で保存しただけ。 画像である 画像ではない 3 test.txt.tiff 0バイトファイル
中身空っぽの0バイトファイルをこういう名前で保存しただけ。 画像である 画像ではない 4 IMG_1146.PNG 画像 iPhoneでスクショとった画像。
拡張子も画像。 画像である 画像である 5 IMG_1148.JPG 画像 iPhoneで撮った写真。
拡張子も画像。 画像である 画像である 6 Windows エラー.wav 音声 C:\Windows\Media\Windows エラー.wav。
テキストでも画像でもないが、
「画像ではないバイナリファイル」の例として採用。 画像ではない 画像ではない 7 Windows Error.wav.jpg 音声
C:\Windows\Media\Windows エラー.wav
の、ファイル名末尾に「.jpg」を無理やりつけたもの。
名前変えただけだから、実態は音声ファイルのままで何も変わっていない 画像である 画像ではない


他にも例を挙げだすといろいろあるが、とりあえずこんなところにしておく。
今回紹介した2つの判定ロジックの差が一番わかりやすく出るのはNo1.だろう。
実態は写真(画像)なのに、拡張子判定だと画像と判定されないが、ImageIOだと画像と判定してくれる。

逆に、No.2やNo.3のような例では、拡張子判定だと画像と判定されるが、ImageIOだと画像と判定しない。
まあ0バイトだから、拡張子判定で画像と判定して先に進んでも、
冒頭のチェック例でいうと3.のチェック(ファイル容量のチェック)でひっかかって結局止まりそうだが。

といいつつ、No.1のような例は、
まあ、確かに、実態は画像なのは間違いないが、
「意図的に拡張子を変えている」ということを考えると、
「ImageIO#readの結果でOKになったから」といって画像と判定しきってしまうのも正直早計な気はする。
意図したものかどうかに寄らず、実態に即した拡張子とは異なるわけだから、
「実態は画像であっても、本来あるべきファイルの姿ではない」というように解釈し、
つまり結果的に「画像ではない!」と判定してあげるのが正しい姿なのだろう。
なので、画像チェックとしての正解は、
”「拡張子チェック」+「ImageIO#readでのチェック」で両方がtrueになったら画像”
なのだろうな。

なお、実態が画像であれば、拡張子に関わらず、HTMLのimgタグに設定しても画像として表示してくれるようではある。
これは、画像データをBASE64形式でエンコードしてimgタグのsrc属性に指定するやり方ができることからも、なんとなく想像がつくことではある(実態が画像を指していれば画像になる)が、
画像としての使用用途は別にHTMLに限った話ではないはずだし、やはり拡張子と実態は合っているべきだろう。

rmrmrmarmrmrm 5年前



関連記事
 * 2018-06-13
   【Java】実行時引数をいろいろ変えてmain(String[] args)の中身を見てみよう
   ちょこちょこ気にはなってたんだけどあんまり深く追求しようと…
 * 2018-01-30
   【Java】【HTML】特定の文字をサーバにPOSTすると、あるブラウザでPOSTしたときだけ違う文…
   「テキストボックスやテキストエリアに文字を入力してサーバにP…
 * 2016-01-26
   【java】FileFilterメモ
   File#listFilesでFileオブジェクトの配列を取得するとき、FileF…
 * 2015-06-24
   【java】XMLからXSLを通じてHTMLを出力する整形をJavaで指示する
   XMLをXSLを通じてHTMLに変換するやり方のサンプル(javaソース)
 * 2015-01-09
   【java】Serializableについて
   javaにはオブジェクトの内容をそのままファイルにして出力した…

 * もっと読む

コメントを書く
« 【障害記録】No.2:多重明細の一つだけが… 【障害記録】No.1:データ削除条件と画面… »

プロフィール
rmrmrmarmrmrm はてなブログPro
読者です 読者をやめる 読者になる 読者になる
21
このブログについて
Twitter

検索

最新記事
 * ストレイテナーのベスト盤投票をした話
   日記
 * 【ストレイテナー】Silver Lining Tour@中野サンプラザ
   ライブいってきた
 * 【9mm Parabellum Bullet】19 th Anniversary Tour@F.A.D. YOKOHAMA
   ライブいってきた
 * ひなっちのおはっちのサイトをsunsetする
   GCP IT人の雑談
 * Prisma Getting Startedの記録+α
   Node.js Heroku Postgresql関連

月別アーカイブ
 * ▼ ▶
   2023 (11)
   * 2023 / 6 (1)
   * 2023 / 5 (1)
   * 2023 / 4 (3)
   * 2023 / 3 (3)
   * 2023 / 2 (1)
   * 2023 / 1 (2)
 * ▼ ▶
   2022 (28)
   * 2022 / 12 (3)
   * 2022 / 11 (3)
   * 2022 / 10 (3)
   * 2022 / 9 (2)
   * 2022 / 8 (3)
   * 2022 / 7 (2)
   * 2022 / 6 (2)
   * 2022 / 5 (1)
   * 2022 / 4 (1)
   * 2022 / 3 (3)
   * 2022 / 2 (3)
   * 2022 / 1 (2)
 * ▼ ▶
   2021 (30)
   * 2021 / 12 (4)
   * 2021 / 11 (3)
   * 2021 / 10 (3)
   * 2021 / 9 (3)
   * 2021 / 8 (1)
   * 2021 / 7 (1)
   * 2021 / 6 (2)
   * 2021 / 5 (4)
   * 2021 / 4 (1)
   * 2021 / 3 (3)
   * 2021 / 2 (2)
   * 2021 / 1 (3)
 * ▼ ▶
   2020 (38)
   * 2020 / 12 (4)
   * 2020 / 11 (2)
   * 2020 / 10 (3)
   * 2020 / 9 (3)
   * 2020 / 8 (2)
   * 2020 / 7 (2)
   * 2020 / 6 (3)
   * 2020 / 5 (3)
   * 2020 / 4 (5)
   * 2020 / 3 (3)
   * 2020 / 2 (3)
   * 2020 / 1 (5)
 * ▼ ▶
   2019 (46)
   * 2019 / 12 (7)
   * 2019 / 11 (3)
   * 2019 / 10 (4)
   * 2019 / 9 (3)
   * 2019 / 8 (3)
   * 2019 / 7 (1)
   * 2019 / 6 (5)
   * 2019 / 5 (4)
   * 2019 / 4 (5)
   * 2019 / 3 (3)
   * 2019 / 2 (3)
   * 2019 / 1 (5)
 * ▼ ▶
   2018 (62)
   * 2018 / 12 (3)
   * 2018 / 11 (3)
   * 2018 / 10 (4)
   * 2018 / 9 (3)
   * 2018 / 8 (3)
   * 2018 / 7 (5)
   * 2018 / 6 (5)
   * 2018 / 5 (5)
   * 2018 / 4 (5)
   * 2018 / 3 (6)
   * 2018 / 2 (9)
   * 2018 / 1 (11)
 * ▼ ▶
   2017 (58)
   * 2017 / 12 (9)
   * 2017 / 11 (6)
   * 2017 / 10 (7)
   * 2017 / 9 (8)
   * 2017 / 8 (5)
   * 2017 / 7 (6)
   * 2017 / 6 (4)
   * 2017 / 5 (3)
   * 2017 / 4 (2)
   * 2017 / 3 (1)
   * 2017 / 2 (4)
   * 2017 / 1 (3)
 * ▼ ▶
   2016 (70)
   * 2016 / 12 (3)
   * 2016 / 11 (8)
   * 2016 / 10 (3)
   * 2016 / 9 (7)
   * 2016 / 8 (4)
   * 2016 / 7 (4)
   * 2016 / 6 (6)
   * 2016 / 5 (7)
   * 2016 / 4 (10)
   * 2016 / 3 (9)
   * 2016 / 2 (4)
   * 2016 / 1 (5)
 * ▼ ▶
   2015 (46)
   * 2015 / 12 (1)
   * 2015 / 11 (1)
   * 2015 / 10 (3)
   * 2015 / 9 (5)
   * 2015 / 8 (7)
   * 2015 / 7 (6)
   * 2015 / 6 (1)
   * 2015 / 5 (1)
   * 2015 / 4 (5)
   * 2015 / 3 (2)
   * 2015 / 2 (4)
   * 2015 / 1 (10)
 * ▼ ▶
   2014 (96)
   * 2014 / 12 (20)
   * 2014 / 11 (17)
   * 2014 / 10 (10)
   * 2014 / 9 (9)
   * 2014 / 8 (4)
   * 2014 / 7 (3)
   * 2014 / 6 (2)
   * 2014 / 5 (29)
   * 2014 / 4 (2)

カテゴリー
 * ライブいってきた (101)
 * 日記 (93)
 * Java関連 (40)
 * ゲーム (39)
 * OracleDatabase関連 (35)
 * プログラミングいろいろ (21)
 * IT人の雑談 (21)
 * UNIX/Solaris関連 (14)
 * HTML関連 (14)
 * 障害台帳 (12)
 * 資格 (10)
 * javascript/jQuery関連 (9)
 * Node.js (9)
 * AWS (8)
 * GCP (8)
 * ダイエット (8)
 * OracleCloud関連 (7)
 * 行く年来る年 (7)
 * 夢日記 (7)
 * どうでもいい (7)
 * Docker (7)
 * Heroku (5)
 * Windows/コマンドプロンプト関連 (5)
 * Microsoft Excel関連 (4)
 * Kubernetes (3)
 * 転職 (3)
 * XSL関連 (3)
 * Instagram (3)
 * PHP関連 (2)
 * VirtualBox関連 (2)
 * Postgresql関連 (2)
 * MySQL関連 (2)
 * Cloudflare (2)
 * Ruby (1)
 * Azure (1)

BlogCommutinyLink

にほんブログ村

にほんブログ村

システムエンジニアランキング


はてなブログをはじめよう!

rmrmrmarmrmrmさんは、はてなブログを使っています。あなたもはてなブログをはじめてみませんか?

はてなブログをはじめる(無料)
はてなブログとは
RM-BLOG

Powered by Hatena Blog | ブログを報告する




引用をストックしました

ストック一覧を見る 閉じる

引用するにはまずログインしてください

ログイン 閉じる

引用をストックできませんでした。再度お試しください

閉じる

限定公開記事のため引用できません。

読者です 読者をやめる 読者になる 読者になる
21