Windowsにnmapをインストールする

Windowsにnmapをインストールする方法をまとめます。

はじめに

おはよう。@bioerrorlogです。

nmapは、ネットワークをスキャンするときに便利なコマンドです。 個人的にはLinuxでは使ったことがあったものの、Windowsでは使ったことがありませんでした。

今回は、Windowsへのnmapインストール方法を備忘録に残します。

Windowsにnmapをインストールする

Chocolateyからインストールする

パッケージマネージャにChocolateyを利用している場合、以下の手順で簡単にインストールできます。

  1. コマンドプロンプトを「管理者として実行」
  2. choco install nmapでnmapをインストール
  3. nmap --versionでnmapがインストールされたことを確認

以下、一つずつ見ていきます。


1.検索バーなどからコマンドプロンプトを検索し、右クリックで「管理者として実行」します。

「管理者として実行」せずにコマンドプロンプトを起動した場合は、インストールのための権限が不足してエラーになってしまうので注意してください。


2.コマンドプロンプトが開いたらchoco install nmapを実行して、nmapをインストールします。

>choco install nmap
Chocolatey v0.10.15
Installing the following packages:
nmap
By installing you accept licenses for the packages.

nmap v7.80 [Approved]
nmap package files install completed. Performing other installation steps.
The package nmap wants to run 'chocolateyInstall.ps1'.
Note: If you don't run this script, the installation will fail.
Note: To confirm automatically next time, use '-y' or consider:
choco feature enable -n allowGlobalConfirmation
Do you want to run the script?([Y]es/[A]ll - yes to all/[N]o/[P]rint): Y

Installing nmap...
nmap has been installed.
nmap installed to 'C:\Program Files (x86)\Nmap'
  nmap may be able to be automatically uninstalled.
Environment Vars (like PATH) have changed. Close/reopen your shell to
 see the changes (or in powershell/cmd.exe just type `refreshenv`).
 The install of nmap was successful.
  Software installed as 'exe', install location is likely default.

Chocolatey installed 1/1 packages.
 See the log for details (C:\ProgramData\chocolatey\logs\chocolatey.log).


3.最後に、nmapがインストールされたことを確認します。

コマンドプロンプトを開きなおして、nmap --versionを実行してください。

>nmap --version
Nmap version 7.80 ( https://nmap.org )
Platform: i686-pc-windows-windows
Compiled with: nmap-liblua-5.3.5 openssl-1.0.2s nmap-libssh2-1.8.2 nmap-libz-1.2.11 nmap-libpcre-7.6 Npcap-0.9982 nmap-libdnet-1.12 ipv6
Compiled without:
Available nsock engines: iocp poll select

上記のように表示されたらインストールは成功です。


nmapインストーラからインストールする

公式のnmapインストーラを利用してインストールすることもできます。


1.まず以下の公式サイトから、Windows用のnmapインストーラをダウンロードします。

Download the Free Nmap Security Scanner for Linux/Mac/Windows

f:id:BioErrorLog:20210722114848p:plain


2.ダウンロードしたインストーラを実行します。

この際、「このアプリがデバイスに変更を加えることを許可しますか?」と聞かれるので許可します。


3.nmapインストーラウィンドウに従って、インストールを進めます。

f:id:BioErrorLog:20210722115238p:plain
"I Agree" を選択する

f:id:BioErrorLog:20210722115333p:plain
"Next >" を選択する

f:id:BioErrorLog:20210722115418p:plain
"Install" を選択する


4.nmapインストールの途中にNpcapのインストールウィンドウが開くので、画面に従いインストールを進めます。

f:id:BioErrorLog:20210722115955p:plain
"I Agree" を選択する

f:id:BioErrorLog:20210722120037p:plain
"Install" を選択する

f:id:BioErrorLog:20210722120133p:plain
Npcapのインストールが終わったら"Next >" を選択する

f:id:BioErrorLog:20210722120226p:plain
"Finish" を選択する


5.nmapインストーラに戻り、インストールを完了させます。

f:id:BioErrorLog:20210722120512p:plain
"Next >" を選択する

f:id:BioErrorLog:20210722120555p:plain
"Next >" を選択する

f:id:BioErrorLog:20210722120629p:plain
"Finish" を選択する


6.nmapインストールが終わったら、コマンドプロンプトからnmapがインストールされたことを確認します。

コマンドプロンプトを開いて、nmap --versionを実行してください。

>nmap --version
Nmap version 7.91 ( https://nmap.org )
Platform: i686-pc-windows-windows
Compiled with: nmap-liblua-5.3.5 openssl-1.1.1h nmap-libssh2-1.9.0 nmap-libz-1.2.11 nmap-libpcre-7.6 Npcap-1.00 nmap-libdnet-1.12 ipv6
Compiled without:
Available nsock engines: iocp poll select

上記のように表示されたらインストールは成功です。

おわりに

Windowsにnmapをインストールする方法を整理しました。

Linuxの場合はパッケージマネージャからインストールでいいけどWindowsの場合はどうなんだろう?と思ってまとめた次第、どなたかの参考になれば幸いです。

[関連記事]

www.bioerrorlog.work

www.bioerrorlog.work

www.bioerrorlog.work

参考

Install Nmap on Windows | Nmap

Chocolatey: choco install nmap | Netscylla’s Blog

Download the Free Nmap Security Scanner for Linux/Mac/Windows

nmap(1) - Linux man page

Chocolatey Software | Chocolatey - The package manager for Windows

IAM Policyの"Action"に指定できる権限の一覧はどこにあるのか

IAM Policyの"Action"区内に指定できるaction権限の一覧が記載されている場所の備忘録です。

はじめに

おはよう。@bioerrorlogです。

IAM Policyの"Action"には、各AWSサービスのaction権限を指定します。 しかし、各サービスで提供されている全てのAPIが、IAM Policyの"Action"に指定できるわけではありません。 逆に、サービスからAPIとして提供されていないものでも、IAM Policyの"Action"に指定できるものがあります。

ドキュメントにも、以下のように記載されています。

Not all API operations that are defined by a service can be used as an action in an IAM policy. In addition, a service might define some actions that don't directly correspond to an API operation.


例えば、S3ではListBucketsというAPIが提供されていますが、IAM Policyの"Action"に "s3:ListBuckets"としてそのまま権限を指定することはできません。 サービスのAPI Referenceに記載されているからといって、必ずしもIAM Policyの"Action"に記載できる訳ではない、ということです。


[関連記事] S3 ListBucketsの実行に必要なIAM権限


では、IAM Policyの"Action"に指定できるaction権限の一覧はどこで調べればよいのでしょうか?

その場所を見つけたので備忘録を残します。


IAM Policyの"Action"に指定できるaction権限の一覧

場所

IAM Policyの"Action"に指定できるaction一覧は、以下に記載されています。

docs.aws.amazon.com

使い方

使い方は単純です。

まず、サイドバーから対象のサービス(例: S3)を選択します。

f:id:BioErrorLog:20210116110718p:plain


サービス毎のページに飛んだら、そこに"Action"として指定できるaction権限の一覧があります。

f:id:BioErrorLog:20210116111522p:plain


ちなみに、このドキュメントにはActionに関する情報だけでなくResource typeやCondition keyについての情報も記載されています。 IAM Policyを設計する際には大いに参考にできそうです。

おわりに

今回は、IAM Policyの"Action"に指定できるaction権限一覧の場所を記しました。

これまでは、各サービスのAPI Referenceを参照しながらIAM Policyを書くことが多かったので、たまに権限付与が上手くいかないケースがありました。 これからは今回取り上げたドキュメントを参照して、正しくActionを把握していきたいところです。

それにしても、権限周りはなかなかに奥が深くて面白いですね。

[関連記事]

www.bioerrorlog.work

www.bioerrorlog.work

www.bioerrorlog.work

参考

Actions, resources, and condition keys for AWS services - Service Authorization Reference

S3バケットポリシーとIAMポリシーの関係を整理する

S3バケットポリシーとIAMポリシーの関係を、同一アカウント・クロスアカウントそれぞれにおいて整理します。


はじめに

おはよう。@bioerrorlogです。

S3に対するアクセス権限の制御方法としては、アクセス元のIAMポリシーとアクセス先のバケットポリシーのふたつが挙げられます。

f:id:BioErrorLog:20201122113644p:plain
S3に対するアクセス権限の制御

IAMポリシーとバケットポリシーのどちらで制御すればよいのか、はたまた両方で制御する必要があるのか、油断してると忘れそうになります。

今回は、このIAMポリシーとバケットポリシーでの制御方法の関係性について、同一アカウント内の場合とクロスアカウントの場合でそれぞれ整理します。


S3バケットポリシーとIAMポリシーの関係

結論

まず簡潔に結論を言うと、以下のようになります。

f:id:BioErrorLog:20201122182412p:plain

  • 同一アカウント内アクセス:
    S3バケットポリシーかIAMポリシーのどちらかで許可が必要
  • クロスアカウントアクセス:
    S3バケットポリシーとIAMポリシーの両方で許可が必要
  • S3バケットポリシーかIAMポリシーのどちらかで拒否された場合は拒否される


以降、EC2からS3にGetObjectする場合をもとに検証していきます。


検証準備

EC2に付与するIAMポリシーとして、以下のものを用意します。

  • アクセス許可用
{
    "Version": "2012-10-17",
    "Statement": [
        {
            "Effect": "Allow",
            "Action": [
                "s3:GetObject"
            ],
            "Resource": "arn:aws:s3:::[ターゲットバケット名]/*"
        }
    ]
}


  • アクセス拒否用
{
    "Version": "2012-10-17",
    "Statement": [
        {
            "Effect": "Deny",
            "Action": [
                "s3:GetObject"
            ],
            "Resource": "arn:aws:s3:::[ターゲットバケット名]/*"
        }
    ]
}


バケットポリシーとしては、以下のものを用意します。

  • アクセス許可用
{
    "Version": "2012-10-17",
    "Statement": [
        {
            "Effect": "Allow",
            "Principal": {
                "AWS": "arn:aws:iam::[アカウントid]:role/[EC2にアタッチしたRole名]"
            },
            "Action": [
                "s3:GetObject"
            ],
            "Resource": [
                "arn:aws:s3:::[バケット名]/*"
            ]
        }
    ]
}


  • アクセス拒否用
{
    "Version": "2012-10-17",
    "Statement": [
        {
            "Effect": "Deny",
            "Principal": {
                "AWS": "arn:aws:iam::[アカウントid]:role/[EC2にアタッチしたRole名]"
            },
            "Action": [
                "s3:GetObject"
            ],
            "Resource": [
                "arn:aws:s3:::[バケット名]/*"
            ]
        }
    ]
}


EC2からGetObjectするには、以下のCLIを利用します。

aws s3api get-object --bucket [ターゲットバケット名] --key [オブジェクトキー] [ファイル保存名]


以上の条件で、各ケースにおけるアクセス可否を検証します。


同一アカウント内アクセス

f:id:BioErrorLog:20201122145111p:plain
同一アカウント内でのS3アクセス

まずは、同一アカウント内からのS3アクセスを検証します。

IAMポリシー バケットポシリー アクセス可否
- - Access Denied
Allow - Succeed
- Allow Succeed
Allow Allow Succeed
Deny Allow Access Denied
Allow Deny Access Denied

このように、同一アカウント内では

  • S3バケットポリシーかIAMポリシーのどちらかで許可されば許可される
  • S3バケットポリシーかIAMポリシーのどちらかで拒否された場合は拒否される

という挙動になります。


クロスアカウントアクセス

f:id:BioErrorLog:20201122150640p:plain
クロスアカウントでのS3アクセス

続いて、クロスアカウントでのS3アクセスを検証します。

IAMポリシー バケットポシリー アクセス可否
- - Access Denied
Allow - Access Denied
- Allow Access Denied
Allow Allow Succeed
Deny Allow Access Denied
Allow Deny Access Denied

このように、クロスアカウントでは

  • S3バケットポリシーかIAMポリシーの両方で許可されば許可される
  • S3バケットポリシーかIAMポリシーのどちらかで拒否された場合は拒否される

という挙動になります。


以上をまとめると、S3バケットポリシーとIAMポリシーの関係は以下のようになります(再掲)。

f:id:BioErrorLog:20201122182412p:plain

  • 同一アカウント内アクセス:
    S3バケットポリシーかIAMポリシーのどちらかで許可が必要
  • クロスアカウントアクセス:
    S3バケットポリシーとIAMポリシーの両方で許可が必要
  • S3バケットポリシーかIAMポリシーのどちらかで拒否された場合は拒否される


おわりに

今回は、S3バケットポリシーとIAMポリシーの関係を整理しました。

AWSを触っていると、IAM権限周りの正確な理解がとても重要と感じています。

今回取り上げた話題は比較的シンプルな話でしたが、一つ一つ整理していくことで、権限周りの自信を深めていきたいところです。

[関連記事]

www.bioerrorlog.work

www.bioerrorlog.work

www.bioerrorlog.work

参考

Amazon S3 がバケットオペレーションのリクエストを許可する方法 - Amazon Simple Storage Service

S3 バケット内のオブジェクトへのクロスアカウントアクセスを許可する - AWSナレッジセンター

Amplifyプロジェクトのgitリポジトリを公開するときの注意点

AWS Amplifyプロジェクトのgitリポジトリをパブリックにするときのセキュリティ上の注意点についての備忘録です。

一言で言うと、team-provider-info.jsonをgit管理から外すべし、となります。


はじめに

おはよう。@bioerrorlogです。

最近、Amplifyをよく使います。

主にReact + Amplifyの組み合わせで開発していますが、APIの作成やCognito連携、Hosting環境やCI/CDパイプライン立ち上げなどが極めて容易にできるため、とても有用なサービスだと感じています。

ここでふと、AmplifyプロジェクトをGitHubなどで公開しようと思ったとき、リポジトリをそのままpushしていいものだろうかと不安になりました。

もともとAmplifyによって.gitignoreが追記され、いくつかのファイルが除外されてはいますが、全世界にgitを公開する場合には、それだけでは不十分なのではないか?ということです。

今回は、Amplifyリポジトリを公開する際にgitから除外すべきファイルを調べました。


作業環境

Amplify CLIバージョン

$ amplify --version
4.21.0


Amplifyプロジェクト環境: Javascript / React

$ amplify init
Note: It is recommended to run this command from the root of your app directory
? Enter a name for the project amplify
? Enter a name for the environment dev
? Choose your default editor: None
? Choose the type of app that you're building javascript
Please tell us about your project
? What javascript framework are you using react
? Source Directory Path:  src
? Distribution Directory Path: build
? Build Command:  npm run-script build
? Start Command: npm run-script start


Amplifyプロジェクトのgitリポジトリを公開するときの注意点

Amplifyの.gitignoreファイル

まず、Amplifyによって生成される.gitignoreを確認します。
ここに記載されたファイルはgit管理されないので、機密な情報が含まれていても問題ありません。

# See https://help.github.com/articles/ignoring-files/ for more about ignoring files.

# dependencies
/node_modules
/.pnp
.pnp.js

# testing
/coverage

# production
/build

# misc
.DS_Store
.env.local
.env.development.local
.env.test.local
.env.production.local

npm-debug.log*
yarn-debug.log*
yarn-error.log*

#amplify
amplify/\#current-cloud-backend
amplify/.config/local-*
amplify/mock-data
amplify/backend/amplify-meta.json
amplify/backend/awscloudformation
build/
dist/
node_modules/
aws-exports.js
awsconfiguration.json
amplifyconfiguration.json
amplify-build-config.json
amplify-gradle-config.json
amplifytools.xcconfig

amplify-meta.jsonなど、アカウント情報が記載されたファイルがgit管理から排除されているのが確認できます。


git管理されるAmplify関連ファイル

次に、git管理に含まれるファイルを以下の手順で確認してみます。

  1. amplify add authamplify add apiでAPIとAuthを作成
  2. amplify pushでamplifyバックエンドを構築
  3. これら処理によってgit管理に追加されたファイルを確認

結果、次のファイルがgitに追加されました。

new file:   .graphqlconfig.yml
new file:   amplify/.config/project-config.json
new file:   amplify/backend/api/amplify/parameters.json
new file:   amplify/backend/api/amplify/schema.graphql
new file:   amplify/backend/api/amplify/stacks/CustomResources.json
new file:   amplify/backend/api/amplify/transform.conf.json
new file:   amplify/backend/auth/amplifyc38b6d9a/amplifyc38b6d9a-cloudformation-template.yml
new file:   amplify/backend/auth/amplifyc38b6d9a/parameters.json
new file:   amplify/backend/backend-config.json
new file:   amplify/team-provider-info.json
new file:   src/graphql/mutations.js
new file:   src/graphql/queries.js
new file:   src/graphql/schema.json
new file:   src/graphql/subscriptions.js

これらファイルを上から確認していきます。

  • .graphqlconfig.yml
    GraphQLのスキーマファイルのパスなどを記載

  • amplify/.config/project-config.json
    プロジェクト名やビルドコマンドなどを記載

  • amplify/backend/api/amplify/parameters.json
    API設定や認証用Cognito情報などを記載

  • amplify/backend/api/amplify/schema.graphql
    GraphQLスキーマを定義

  • amplify/backend/api/amplify/stacks/CustomResources.json
    CloudFormationテンプレートファイル

  • amplify/backend/api/amplify/transform.conf.json
    何かの設定が記載:
    { "Version": 5, "ElasticsearchWarning": true }

  • amplify/backend/auth/amplifyc38b6d9a/amplifyc38b6d9a-cloudformation-template.yml
    CloudFormationテンプレートファイル

  • amplify/backend/auth/amplifyc38b6d9a/parameters.json
    Auth用の各設定が記載

  • amplify/backend/backend-config.json
    作成したバックエンドカテゴリ情報が記載

  • amplify/team-provider-info.json
    各リソースのARNなどが記載

  • src/graphql/*
    GraphQLのquery/mutation/subscription定義

ここで、amplify/team-provider-info.jsonにリソースのARNなどが記載されている点には注意が必要でしょう。 Secret Keyなどが直接書かれているわけではありませんが、AWS Account IdやAmplifyAppIdなどが記載されています。

gitを公開する際は、amplify/team-provider-info.jsonは、除いた方が良いでしょう。

結論: team-provider-info.jsonはgit管理から外すべし

以上、ここまで見てきたように、全世界にgitを公開する場合にはteam-provider-info.jsonを外すべきかと思います。

Issueでの議論でも、Amplifyの中の人が次のように発言しています。

The purpose of this file is basically sharing it within your team-members on the same project and want to update/use the same AWS Infrastructure tied to an environment. If you're open-sourcing your project you can totally get rid of this file (or make it a part of .gitignore).

意訳すると、次のような感じでしょうか。
「このファイル(team-provider-info.json)の基本的な役割は、プロジェクトのチームメンバーとバックエンド環境を連携させることです。 もしプロジェクトをオープンソース化するなら、このファイルは削除するか.gitignoreに含めるといいでしょう。」

この先Amplifyプロジェクトを公開するときは、このことを留意したいと思います。


関連記事

www.bioerrorlog.work

www.bioerrorlog.work


参考

Security best practices for Amplify app in a public repo · Issue #1779 · aws-amplify/amplify-cli · GitHub

Amplify Framework Documentation

初心者が挑むCTF入門 | OverTheWire: Bandit Level 0~20

CTF入門として評判のOverTheWire: Banditを、前提知識のほとんどない状態から挑んでみました。 始め方から、問題を解く際の試行錯誤までを詳細に記録します。

まずはLevel0からLevel10までを解いてみました。

[追記]Level20まで追加しました。


はじめに

おはよう。@bioerrorlogです。

CTFをやってみたいと思い立ちました。 きっかけはこのLiveOverfow氏の動画です。

youtu.be

彼のリバースエンジニアリング入門動画などは好きで見ていたので1、彼の勧めるCTFには以前から興味がありました。

CTF (Capture The Flag)とは、その名の通り旗取り合戦のことです。 FPSゲームでの陣取り合戦もこれに当たるようですが、ここではコンピュータセキュリティにおけるCTFを指しています。 CTF用に用意されたサーバーに入ったり、プログラムを解析したりして、Flagと呼ばれる文字列の発見を目指すクイズ形式の競技のようなものだそうです。

キャプチャー・ザ・フラッグ - Wikipedia

正直あまりイメージが掴めませんが、とても面白そうな香りがします。 私はネットワークも全くわからない初心者なので、とりあえず初心者向けのCTFに挑戦してみたいと思います。

CTFには制限時間がある競技形式のものと、常に開かれている常設CTFがあります。 競技形式のものは初心者にはハードルが高いので、常設CTFをやってみることにしました。

上の動画でもおすすめされている、OverTheWireというサイトで開かれているCTFに挑んでみることにします。

overthewire.org

このサイトのWargamesというCTF集のうち、もっとも初心者向けのBanditをやっていきます。

右も左もわからない状態なので、ひとつひとつ確認していきながら、試行錯誤の記録を残します。


[関連記事] 逆アセンブル解析 - gdb | リバースエンジニアリング入門#2


作業環境

OSについては注意が必要です。 ターミナルからのUnixコマンド操作を前提としているそうなので、Windowsでやろうとすると何かと厄介でしょう。

私はUbuntu18.04.1 LTS を
Windows10の上に、VMwareによって構築した仮想環境で起動しています。
www.bioerrorlog.work


OverTheWire: Bandit


Level 0

sshの使い方

OverTheWire: Bandit Level 0

それではLevel0からやっていきます。 問題文はこれです。

The goal of this level is for you to log into the game using SSH. The host to which you need to connect is bandit.labs.overthewire.org, on port 2220. The username is bandit0 and the password is bandit0. Once logged in, go to the Level 1 page to find out how to beat Level 1.

sshなるものを用いて、このサイトにログインするのが一番最初のLevel 0 の目的のようです。

ログインするホスト名は bandit.labs.overthewire.org
ポート番号は 2220
ユーザーネームは bandit0
パスワードは bandit0
となっています。

ログインという操作は日常的に慣れ親しんでいますが、ここで出てきたsshコマンドでのログインには経験がありません。 少し調べることにします。

まずはsshのマニュアルを読みます。

$ man ssh
NAME
 ssh — OpenSSH SSH client (remote login program)
~
DESCRIPTION
 ssh (SSH client) is a program for logging into a remote machine and for
 executing commands on a remote machine. 

sshは、遠隔マシンにログインしてコマンドを実行するためのプログラムのようです。 今回の私のケースだとbandit.labs.overthewire.org にログインして、そこでコマンド操作が行えるようになる、ということでしょう。

マニュアルを読み進めて、sshコマンドの使い方を調べます。

SYNOPSIS
 ssh [-46AaCfGgKkMNnqsTtVvXxYy] [-b bind_address] [-c cipher_spec]
   [-D [bind_address:]port] [-E log_file] [-e escape_char]
   [-F configfile] [-I pkcs11] [-i identity_file]
   [-J [user@]host[:port]] [-L address] [-l login_name] [-m mac_spec]
   [-O ctl_cmd] [-o option] [-p port] [-Q query_option] [-R address]
   [-S ctl_path] [-W host:port] [-w local_tun[:remote_tun]]
   [user@]hostname [command]

膨大なオプションの記述に圧倒されそうですが、落ち着いて今回必要な部分を抽出します。 今回ログインに使う情報は、ホスト名、ポート番号、ユーザー名、パスワードでした。 これらを上のオプションから読み出すと、使い方は次のようになるはずです。

ssh hostname [-l login_name] [-p port] 

パスワードを指定するオプションが見当たりませんが、後で接続時に要求されるのでしょうか。

とりあえずこれに従うなら、

ssh bandit.labs.overthewire.org -l bandit0 -p 2220 

とすれば上手くいきそうです。

※次のように記述しても上手くいきました。
ssh bandit0@bandit.labs.overthewire.org -p 2220

コマンドを実践する前に、もう一点確認したいことがあります。 sshで接続を確立した後、どのようにして接続を切ればいいのでしょうか。 再びマニュアルを確認すると、

~.      Disconnect.

接続を切るには ~. と入力すれば良いようです。

exitと入力しても、接続を終了することができました。


以上でだいたい使い方は分かりました。
さっそく実践してみます。


sshログイン

それでは上記コマンドを実行します。

$ ssh bandit.labs.overthewire.org -l bandit0 -p 2220
 
The authenticity of host '[bandit.labs.overthewire.org]:2220 ([176.9.9.172]:2220)'
can't be established.ECDSA key fingerprint is 
SHA256:98UL0ZWr85496EtCRkKlo20X3OPnyPSB5tB5RPbhczc.
Are you sure you want to continue connecting (yes/no)? 

何やら警告を吐かれました。 ホストの信憑性が確立できませんでしたが、接続を続けていいですか?という感じのことを聞かれています。

よくわからなかったので検索をかけてみると、これはログインしたことのないホストにアクセスする際に出る警告だそうです。

yesとして先へ進みます。

yes

Warning: Permanently added '[bandit.labs.overthewire.org]:2220,[176.9.9.172]:2220' (ECDSA) to the list of known hosts.
This is a OverTheWire game server. More information on http://www.overthewire.org/wargames

bandit0@bandit.labs.overthewire.org's password: 

パスワードを要求されました。
bandit0を入力すると、

Linux bandit 4.18.12 x86_64 GNU/Linux
               
      ,----..            ,----,          .---. 
     /   /   \         ,/   .`|         /. ./|
    /   .     :      ,`   .'  :     .--'.  ' ;
   .   /   ;.  \   ;    ;     /    /__./ \ : |
  .   ;   /  ` ; .'___,/    ,' .--'.  '   \' .
  ;   |  ; \ ; | |    :     | /___/ \ |    ' ' 
  |   :  | ; | ' ;    |.';  ; ;   \  \;      : 
  .   |  ' ' ' : `----'  |  |  \   ;  `      |
  '   ;  \; /  |     '   :  ;   .   \    .\  ; 
   \   \  ',  /      |   |  '    \   \   ' \ |
    ;   :    /       '   :  |     :   '  |--"  
     \   \ .'        ;   |.'       \   \ ;     
  www. `---` ver     '---' he       '---" ire.org     
               
              
Welcome to OverTheWire!

   ・
   ・ 中略
   ・

  Enjoy your stay!

bandit0@bandit:~$ 
  #  bandit0にログイン完了

見事、bandit0へのログインに成功しました。
Level0の目的達成です。


[関連記事] radare2の使い方 | リバースエンジニアリング入門#5


Level 0 → Level 1

次の問題です。

The password for the next level is stored in a file called readme located in the home directory. Use this password to log into bandit1 using SSH. Whenever you find a password for a level, use SSH (on port 2220) to log into that level and continue the game.

次のレベルに行くためのパスワードは、ホームディレクトリにあるreadmeというファイルに書かれている、とあります。 そのパスワードを用いてbandit1にログインせよ、とのことです。

さっそく調べます。

$ ls    #カレントディレクトリのファイルを表示
readme
$ cat readme    #readmeの中身を表示
boJ9jbbUNNfktd78OOpsqOltutMc3MY1

readmeファイルの中にパスワードboJ9jbbUNNfktd78OOpsqOltutMc3MY1を見つけました。

exitでbandit0への接続を終了してから、見つけたパスワードを使ってbandit1にログインします。

$ ssh bandit.labs.overthewire.org -l bandit1 -p 2220
This is a OverTheWire game server. More information on http://www.overthewire.org/wargames

bandit1@bandit.labs.overthewire.org's password: 
    # boJ9jbbUNNfktd78OOpsqOltutMc3MY1を入力
   ・
   ・ 中略
   ・

  Enjoy your stay!

bandit1@bandit:~$ 

bandit1へのログインに成功しました。 Level1達成です。


Level 1 → Level 2

次の問題です。

The password for the next level is stored in a file called - located in the home directory

パスワードは-というファイルに入っている、とのことです。 さっそく調べてみます。

$ ls
-
$ cat -

  # コマンドが実行されない

ここで問題が生じました。 -ファイルの中身を見るためにcat -を打ち込んだのですが、コマンドが実行されませんでした。

これは考えてみれば当然のことです。 コマンドラインでは-という文字はオプションの指定に使われます。 なので、cat -と打ってしまうと、ターミナルは次に続くオプションの入力を待ってしまうわけです。

そこで、まず思いついたのはエスケープ記号を使うことです。 調べてみると、bashでは3つのエスケープ方法があるようです。 \を打つやり方、シングルクオーテーション' 'で囲むやり方、ダブルクオーテーション" "で囲むやり方です。

しかし、このどれを実行しても今回の問題は解決されませんでした。

そこで、別の方法を考えてみます。 思いついたのは、もう少し丁寧にファイル名を指定してあげることです。 つまり、パスを含めてファイルを指定します。

$ cat ./-
CV1DtqXWVFXTvM2F0k09SHz0YwRINYA9

見事、パスワードを読み出すことができました。

このパスワードを使ってLevel2にログインすれば、Level1達成です。


Level 2 → Level 3

次の問題です。

The password for the next level is stored in a file called spaces in this filename located in the home directory

spaces in this filenameというファイルの中に、次のパスワードが入っているようです。

注意したいのは、ファイル名にスペースが含まれていることです。 そのままのファイル名をcatコマンドに渡すと、次のようにspacesinthisfilenameそれぞれが別のファイルとみなされてしまいます。

$ ls
spaces in this filename
$ cat spaces in this filename
cat: spaces: No such file or directory
cat: in: No such file or directory
cat: this: No such file or directory
cat: filename: No such file or directory

そこで、Level1でも言及したエスケープ文字を使います。 spaces in this filenameを、シングルクォーテーション' 'で囲んであげる訳です。

$ cat 'spaces in this filename'
UmHadQclWmgdLOKQ3YNgjWxGoRMb5luK

これで、パスワードが手に入りました。


Level 3 → Level 4

次の問題です。

The password for the next level is stored in a hidden file in the inhere directory.

inhereディレクトリの中にある隠しファイルに、パスワードが書かれているようです。

まずはinhereディレクトリに移動し、そこにあるファイルをlsコマンドで見てみます。

$ ls
inhere
$ cd inhere    # inhereに移動
$ ls
  #  ファイルが一つも表示されない

lsコマンドでは、ファイルが表示されませんでした。

そこで、lsコマンドのオプション-aを使うことにします。 -aオプションは、マニュアルによると、

-a, --all
 do not ignore entries starting with .

.からはじまる隠しファイルを無視せず表示することができます。

さっそくやってみます。

$ ls -a
.  ..  .hidden

.hiddenという隠しファイルが現れました。 中身を見ます。

$ cat .hidden
pIwrPrtPN36QITSp3EQaw936yaFoFgAB

みごとパスワードがありました。


Level 4 → Level 5

The password for the next level is stored in the only human-readable file in the inhere directory. Tip: if your terminal is messed up, try the “reset” command.

inhereディレクトリの中には"人間が読める"ファイルがあり、そこにパスワードが書いてある、とあります。

さっそくinhereディレクトリに行き、ファイルを見てみます。

$ cd inhere
$ ls -la  #すべてのファイルをリストで表示
total 48
drwxr-xr-x 2 root    root    4096 Oct 16  2018 .
drwxr-xr-x 3 root    root    4096 Oct 16  2018 ..
-rw-r----- 1 bandit5 bandit4   33 Oct 16  2018 -file00
-rw-r----- 1 bandit5 bandit4   33 Oct 16  2018 -file01
-rw-r----- 1 bandit5 bandit4   33 Oct 16  2018 -file02
-rw-r----- 1 bandit5 bandit4   33 Oct 16  2018 -file03
-rw-r----- 1 bandit5 bandit4   33 Oct 16  2018 -file04
-rw-r----- 1 bandit5 bandit4   33 Oct 16  2018 -file05
-rw-r----- 1 bandit5 bandit4   33 Oct 16  2018 -file06
-rw-r----- 1 bandit5 bandit4   33 Oct 16  2018 -file07
-rw-r----- 1 bandit5 bandit4   33 Oct 16  2018 -file08
-rw-r----- 1 bandit5 bandit4   33 Oct 16  2018 -file09

-file00から-file09までの9つのファイルがあります。

どのファイルが"人間が読める"ファイルなのかを確認するために、fileコマンドでファイルタイプを確認します。

ここで、-がそれぞれのファイル名の先頭にあることに注意です。 次のように安易にfileコマンドを使ってしまうと、

$ file *    #  すべてのファイルにfileコマンドを実行
file: Cannot open `ile00' (No such file or directory).
file: Cannot open `ile01' (No such file or directory).
file: Cannot open `ile02' (No such file or directory).
file: Cannot open `ile03' (No such file or directory).
file: Cannot open `ile04' (No such file or directory).
file: Cannot open `ile05' (No such file or directory).
file: Cannot open `ile06' (No such file or directory).
file: Cannot open `ile07' (No such file or directory).
file: Cannot open `ile08' (No such file or directory).
file: Cannot open `ile09' (No such file or directory).

-をオプション記号と捉えられ、うまく実行できません。 そういうときは、Level2で出てきたように、パスから指定してあげれば上手くいきそうです。

$ file ./*
./-file00: data
./-file01: data
./-file02: data
./-file03: data
./-file04: data
./-file05: data
./-file06: data
./-file07: ASCII text
./-file08: data
./-file09: data

まさしく、-file07のみがASCIIテキストファイルであることが分かりました。 中身を見ると、

$ cat ./-file07
koReBOKuIDDepwhWk7jZC0RTdopnAYKh

パスワードが見つかりました。

ちなみに-file07以外のファイルを見ようとすると、

$ cat ./-file01
���U"7�w���H��ê�Q����(���#���

まさに、"人間には理解できない"文字列が入っていました。


Level 5 → Level 6

The password for the next level is stored in a file somewhere under the inhere directory and has all of the following properties:
human-readable
1033 bytes in size
not executable

inhereディレクトリ下のどこかに、次の条件を満たすファイルがあるとのことです。
・"人間が読める"
・1033バイトのファイルサイズ
・実行可能でない

まずはとりあえず、inhereディレクトリのファイルを見てみます

$ cd inhere/
$ ls -la
total 88
drwxr-x--- 22 root bandit5 4096 Oct 16  2018 .
drwxr-xr-x  3 root root    4096 Oct 16  2018 ..
drwxr-x---  2 root bandit5 4096 Oct 16  2018 maybehere00
drwxr-x---  2 root bandit5 4096 Oct 16  2018 maybehere01
drwxr-x---  2 root bandit5 4096 Oct 16  2018 maybehere02
drwxr-x---  2 root bandit5 4096 Oct 16  2018 maybehere03
drwxr-x---  2 root bandit5 4096 Oct 16  2018 maybehere04
drwxr-x---  2 root bandit5 4096 Oct 16  2018 maybehere05
drwxr-x---  2 root bandit5 4096 Oct 16  2018 maybehere06
drwxr-x---  2 root bandit5 4096 Oct 16  2018 maybehere07
drwxr-x---  2 root bandit5 4096 Oct 16  2018 maybehere08
drwxr-x---  2 root bandit5 4096 Oct 16  2018 maybehere09
drwxr-x---  2 root bandit5 4096 Oct 16  2018 maybehere10
drwxr-x---  2 root bandit5 4096 Oct 16  2018 maybehere11
drwxr-x---  2 root bandit5 4096 Oct 16  2018 maybehere12
drwxr-x---  2 root bandit5 4096 Oct 16  2018 maybehere13
drwxr-x---  2 root bandit5 4096 Oct 16  2018 maybehere14
drwxr-x---  2 root bandit5 4096 Oct 16  2018 maybehere15
drwxr-x---  2 root bandit5 4096 Oct 16  2018 maybehere16
drwxr-x---  2 root bandit5 4096 Oct 16  2018 maybehere17
drwxr-x---  2 root bandit5 4096 Oct 16  2018 maybehere18
drwxr-x---  2 root bandit5 4096 Oct 16  2018 maybehere19

maybehere00からmaybehere19までの20個のファイルがありました。 これらのファイルタイプを確認してみると、

$ file *
maybehere00: directory
maybehere01: directory
maybehere02: directory
maybehere03: directory
maybehere04: directory
maybehere05: directory
maybehere06: directory
maybehere07: directory
maybehere08: directory
maybehere09: directory
maybehere10: directory
maybehere11: directory
maybehere12: directory
maybehere13: directory
maybehere14: directory
maybehere15: directory
maybehere16: directory
maybehere17: directory
maybehere18: directory
maybehere19: directory

すべてがディレクトリでした。 これらの中に入っているファイルのうち、上記3つの条件を満たしているものを探します。

findコマンドを用いて、「1033バイトのファイルサイズ」かつ「実行可能でない」ものを検索します。 まずはfindコマンドのマニュアルから、ファイルサイズ検索に関するオプションを探しました。

-size n[cwbkMG]
    File uses n units of space, rounding up.   The  following  suffixes
    can be used:
(中略)
    `c'    for bytes

これによると、-size 1033cとすれば、1033バイトのファイルサイズを持つファイルが見つけられそうです。

次に実行可能性を検索するオプションを探すと、

-executable
    Matches files  which  are  executable  and  directories  which  are
    searchable 

-executableオプションによって、実行可能なファイルが検索できるようです。 今回私は「実行可能でない」ファイルを検索したいので、逆に! -executableとすれば良いでしょう。

この2つの条件でfindしてみます。

$ find -size 1033c ! -executable
./maybehere07/.file2

見事ひとつのファイルが検索に引っかかりました。 このmabehere07ディレクトリにある.file2のファイルタイプを確認すると、

$ file ./maybehere07/.file2
./maybehere07/.file2: ASCII text, with very long lines

ASCIIテキストファイルなので、もう一つの条件「人間が読める」も満たしそうです。 このファイルの中身を見てみます。

$ cat ./maybehere07/.file2
DXjZPULLxYr17uwoI01bNLQbtFemEgo7

見事、パスワードがありました。


Level 6 → Level 7

The password for the next level is stored somewhere on the server and has all of the following properties:
owned by user bandit7
owned by group bandit6
33 bytes in size

サーバーのどこかに、次の3つの条件を満たすファイルがあるそうです。
・ユーザーbandit7に所有されている
・グループbandit6に所有されている
・サイズが33バイト

では、とりあえずfindコマンドで33バイトのファイルを検索してみます。 「サーバーのどこかに」とあるので、ルートディレクトリから検索をかけます。

$ find / -size 33c
  #  /  はルートディレクトリを示す
find: ‘/run/lvm’: Permission denied
find: ‘/run/screen/S-bandit10’: Permission denied
find: ‘/run/screen/S-bandit4’: Permission denied
find: ‘/run/screen/S-bandit3’: Permission denied
find: ‘/run/screen/S-bandit22’: Permission denied
find: ‘/run/screen/S-bandit18’: Permission denied
find: ‘/run/screen/S-bandit17’: Permission denied
find: ‘/run/screen/S-bandit25’: Permission denied
・
・以下略
・

膨大な量のファイルがヒットしてしまいました。 やはり、ファイルサイズ以外の2つの条件を上手く使わないとダメみたいです。

ユーザーとグループによる所有権を検索するオプションがないか、findのマニュアルを調べてみると、

-user uname
    File is owned by user uname (numeric user ID allowed).
・・・
-group gname
    File belongs to group gname (numeric group ID allowed).

-user-groupによって、それぞれの所有権を指定できるようです。 さっそくやってみます。

$ find / -size 33c -user bandit7 -group bandit6
find: ‘/run/lvm’: Permission denied
find: ‘/run/screen/S-bandit10’: Permission denied
find: ‘/run/screen/S-bandit4’: Permission denied
find: ‘/run/screen/S-bandit3’: Permission denied
find: ‘/run/screen/S-bandit22’: Permission denied
find: ‘/run/screen/S-bandit18’: Permission denied
・
・以下略
・

さっきよりは検索結果が絞られましたが、まだfind: ~~~ : Permission deniedなどのエラー出力が大量に残っています。 そこで、検索結果のなかでエラー出力を非表示にする方法を調べました。

出力をリダイレクトする>を使えば、エラーを排除できるようです。 ある記事2によると、

command 2>/dev/null

This syntax redirects the command error output messages to /dev/null where it is ignored by the shell.

2>を使うことで、エラー出力をリダイレクトすることができるそうです3。 そしてリダイレクト先は/dev/nullです。 このファイルに書き込まれたデータは、システムによって破棄されます。

つまり2>/dev/nullとすることで、エラー出力を排除することができるというわけです。 さっそくやってみます。

$ find / -size 33c -user bandit7 -group bandit6 2>/dev/null
/var/lib/dpkg/info/bandit7.password

お見事、ファイルがひとつだけヒットしました。 ファイルを読み出して、目的達成です。

$ cat /var/lib/dpkg/info/bandit7.password
HKBPTKQnIay4Fw76bEy8PVxKEDQRKTzs


Level 7 → Level 8

The password for the next level is stored in the file data.txt next to the word millionth

data.txtファイルの中のmillionthという単語の隣に、次のパスワードがあるそうです。

とりあえずdata.txtを見てみます。

$ ls
data.txt
$ cat data.txt
・
・
Sutherland  GPj6IhYqUlcjb8hYdtbwpKUtIKeSHXNC
Michigan's  rjQZqJB52C0ioveSov6Wt0nLK5zZrUvw
Arthurian   HqnDL5cvz8MhI8ctfyGmQ7OoGVksICqg
matrimony's rQTEVD0A0SvNHsNqgt4GICdnJX86TSkE
tendering   5ARBlVJ1K20R1K7kYNNfp3cJ2KJWm9l1
・
・

このように、[単語] [文字列]となっている行が延々と続いています。 このなかで、millionthの単語に続く文字列がパスワードということでしょう。

grepコマンドに出力を渡し、millionthを検索します。

$ cat data.txt | grep millionth    #catの結果をgrepにパイプする
millionth   cvX2JJa4CFALtqS87jk27qwqGhBM9plV

この右の部分がパスワードです。


[関連記事] Ghidraの使い方 | 初心者がリバースエンジニアリングツールGhidraを使ってみた


Level 8 → Level 9

The password for the next level is stored in the file data.txt and is the only line of text that occurs only once

data.txtの中に一度だけ現れる行がパスワードとなるようです。

一度だけ現れるといえば、uniqコマンドが使えそうです。

NAME
    uniq - report or omit repeated lines
・・・
-u, --unique
    only print unique lines

マニュアルによると、uniq -uとすることで一度だけ現れる行を抽出できるようです。 さっそくやってみます。

$ uniq -u data.txt
KerqNiDbY0zV2VxnOCmWX5XWxumldlAe
MsxcvOe3PGrt78wpZG2bBNF5wfXpZhET
L0nxAwlfV9V3J5onKIT8KYQ9InTcQ7yE
4c7EsUtqLnLR9hiepV5EQVhdMgyi8onL
1drBmDT7PYS7hVgoTWkJSjUZUK7ZAIAa
L0nxAwlfV9V3J5onKIT8KYQ9InTcQ7yE
・
・以下略
・

予想外にも、膨大な行が抽出されてしまいました。 そこで、もう一度真面目にuniqマニュアルを読んでみると、次のような記述がありました。

Note: 'uniq' does not detect repeated lines unless they  are  adjacent.
You  may want to sort the input first, or use 'sort -u' without 'uniq'.

uniqコマンドは、隣り合った行でないと繰り返しを認識しないため、ソートしてから使いなさい、とあります。

そこで、今度はsortコマンドでソートしてからuniqコマンドに渡してみます。

$ sort data.txt | uniq -u
UsvVyFSfZZWbi6wgC7dAFyFuR6jQQUhR

見事、検出された行がひとつに絞られました。 これがパスワードです。


Level 9 → Level 10

The password for the next level is stored in the file data.txt in one of the few human-readable strings, beginning with several ‘=’ characters.

data.txtの中にある"人間が読める"文字列のうち、いくつかの=文字からはじまるものが次のパスワードのようです。

まず、data.txtファイルの中の"人間が読める"文字列を探すために、stringsコマンドを使いました。

$ strings data.txt
.MBB
`B6ha
nK)U2u
&y@@2
5Lo%
ru@n
・
・
・

この表示された大量のテキスト中から、先頭に=を持つ行を検索すれば良いわけです。

検索には、grepコマンドを正規表現と組み合わせて使いました。 つまり、行の先頭を指定する正規表現^を組み合わせて、=を検索するのです。

$ strings data.txt | grep ^=
========== password
========== isa
=FQ?P\U
=   F[
=)$=
========== truKLdjsbJ5g7yyJ2X2R0o3a5HQJFuLk

見事、一番下に出たtruKLdjsbJ5g7yyJ2X2R0o3a5HQJFuLkこそがパスワードです。


Level 10 → Level 11

The password for the next level is stored in the file data.txt, which contains base64 encoded data

次のパスワードは、base64エンコードされたデータを含むdata.txtのなかにあるそうです。

base64とは、wikipediaによると4

Base64は、データを64種類の印字可能な英数字のみを用いて、それ以外の文字を扱うことの出来ない通信環境にてマルチバイト文字やバイナリデータを扱うためのエンコード方式である。 (中略) 具体的には、A–Z, a–z, 0–9 までの62文字と、記号2つ (+, /)、さらにパディング(余った部分を詰める)のための記号として = が用いられる。

A–Z, a–z, 0–9と、+、/そして余った部分に埋められる=を用いて行われるエンコード方式のようです。 これを読み出すには、base64方式でデコードする必要があるということでしょう。

試しに、まずは単純にstringsコマンドでテキストを読み込んでみます。

$ strings data.txt 
VGhlIHBhc3N3b3JkIGlzIElGdWt3S0dzRlc4TU9xM0lSRnFyeEUxaHhUTkViVVBSCg==

この文末の==が、余った部分に埋められるパディングということでしょう。 なので読み出した文字列はVGhlIHBhc3N3b3JkIGlzIElGdWt3S0dzRlc4TU9xM0lSRnFyeEUxaHhUTkViVVBSCgということになります。

しかし、案の定この文字列では次のLevel11にログインすることができませんでした。 base64でデコードしなきゃいけないわけでしょう。

そこでbase64コマンドを使います。 マニュアルによると、

NAME
    base64 - base64 encode/decode data and print to standard output
・・・
-d, --decode
    decode data

base64コマンドの-dオプションを使えば、デコードできるようです。

$ base64 -d data.txt 
The password is IFukwKGsFW8MOq3IRFqrxE1hxTNEbUPR

これでパスワードを見つけました。


Level 11 → Level 12

The password for the next level is stored in the file data.txt, where all lowercase (a-z) and uppercase (A-Z) letters have been rotated by 13 positions

パスワードは、小文字(a-z)と大文字(A-Z)を13個ローテーションさせてあるdata.txtにあるそうです。

文字を13こローテーションさせるとは、どういうことでしょうか。 検索してみると、これは「ROT13」という暗号のようです。 wikipediaによると5

ROT13 または ROT-13、rot13 は単換字式暗号(シーザー暗号)の一つである。アルファベットを一文字毎に13文字後のアルファベットに置き換える。Aは Nに、 B は O に置き換えられ、以下同様である。英語の "Rotate by 13 places" の略。

それではこの暗号を解くために、trコマンドを使います。 trコマンドは、マニュアルによると、

NAME
    tr - translate or delete characters
・・・
SYNOPSIS
    tr [OPTION]... SET1 [SET2]

例えばtr abc 127とすれば、aは1、bは2、cは3と翻訳されるということです。

$ echo abc | tr abc 123
123

つまりROT13を解くためには、それぞれの文字に対応する13個ローテーションさせた翻訳を指定してあげればいいでしょう。 具体的には、次のようにしました。

$ cat data.txt | tr A-Za-z N-ZA-Mn-za-m
The password is 5Te8Y4drgCRfCx8ugdwuEX8KFC6k2EUu

これで、パスワードを割り出すことができました。


Level 12 → Level 13

The password for the next level is stored in the file data.txt, which is a hexdump of a file that has been repeatedly compressed. For this level it may be useful to create a directory under /tmp in which you can work using mkdir. For example: mkdir /tmp/myname123. Then copy the datafile using cp, and rename it using mv (read the manpages!)

パスワードはdata.txtの中に、繰り返し圧縮されたhexdumpとして記述されているようです。 そして、/tmpディレクトリ下にmkdirコマンドで作業用のディレクトリを作り、そこにcpコマンドでデータをコピーするのがいいですよ、と助言しています。

これはどういうことでしょうか。
とりあえずdata.txtの中を見てみます。

$ ls 
data.txt
$ cat data.txt 
00000000: 1f8b 0808 d7d2 c55b 0203 6461 7461 322e  .......[..data2.
00000010: 6269 6e00 013c 02c3 fd42 5a68 3931 4159  bin..<...BZh91AY
00000020: 2653 591d aae5 9800 001b ffff de7f 7fff  &SY.............
00000030: bfb7 dfcf 9fff febf f5ad efbf bbdf 7fdb  ................
00000040: f2fd ffdf effa 7fff fbd7 bdff b001 398c  ..............9.
00000050: 1006 8000 0000 0d06 9900 0000 6834 000d  ............h4..
00000060: 01a1 a000 007a 8000 0d00 0006 9a00 d034  .....z.........4
00000070: 0d1a 3234 68d1 e536 a6d4 4000 341a 6200  ..24h..6..@.4.b.
00000080: 0069 a000 0000 0000 d003 d200 681a 0d00  .i..........h...
00000090: 0001 b51a 1a0c 201e a000 6d46 8068 069a  ...... ...mF.h..
000000a0: 6834 340c a7a8 3406 4000 0680 0001 ea06  h44...4.@.......
000000b0: 8190 03f5 4032 1a00 0343 4068 0000 0686  ....@2...C@h....
000000c0: 8000 0320 00d0 0d00 0610 0014 1844 0308  ... .........D..
000000d0: 04e1 c542 9ab8 2c30 f1be 0b93 763b fb13  ...B..,0....v;..
000000e0: 50c4 c101 e008 3b7a 92a7 9eba 8a73 8d21  P.....;z.....s.!
000000f0: 9219 9c17 052b fb66 a2c2 fccc 9719 b330  .....+.f.......0
00000100: 6068 8c65 e504 5ec0 ae02 fa6d 16bc 904b  `h.e..^....m...K
00000110: ba6c f692 356e c02b 0374 c394 6859 f5bb  .l..5n.+.t..hY..
00000120: 0f9f 528e 4272 22bb 103c 2848 d8aa 2409  ..R.Br"..<(H..$.
00000130: 24d0 d4c8 4b42 7388 ce25 6c1a 7ec1 5f17  $...KBs..%l.~._.
00000140: cc18 ddbf edc1 e3a4 67f1 7a4d 8277 c823  ........g.zM.w.#
00000150: 0450 2232 40e0 07f1 ca16 c6d6 ef0d ecc9  .P"2@...........
00000160: 8bc0 5e2d 4b12 8586 088e 8ca0 e67d a55c  ..^-K........}.\
00000170: 2ca0 18c7 bfb7 7d45 9346 ea5f 2172 01e4  ,.....}E.F._!r..
00000180: 5598 673f 45af 69b7 a739 7814 8706 04ed  U.g?E.i..9x.....
00000190: 5442 1240 0796 6cc8 b2f6 1ef9 8d13 421d  TB.@..l.......B.
000001a0: 461f 2e68 4d91 5343 34b5 56e7 46d0 0a0a  F..hM.SC4.V.F...
000001b0: 72b7 d873 71d9 6f09 c326 402d dbc0 7cef  r..sq.o..&@-..|.
000001c0: 53b1 df60 9ec7 f318 00df 3907 2e85 d85b  S..`......9....[
000001d0: 6a1a e105 0207 c580 e31d 82d5 8646 183c  j............F.<
000001e0: 6a04 4911 101a 5427 087c 1f94 47a2 270d  j.I...T'.|..G.'.
000001f0: ad12 fc5c 9ad2 5714 514f 34ba 701d fb69  ...\..W.QO4.p..i
00000200: 8eed 0183 e2a1 53ea 2300 26bb bd2f 13df  ......S.#.&../..
00000210: b703 08a3 2309 e43c 44bf 75d4 905e 5f96  ....#..<D.u..^_.
00000220: 481b 362e e82d 9093 7741 740c e65b c7f1  H.6..-..wAt..[..
00000230: 5550 f247 9043 5097 d626 3a16 da32 c213  UP.G.CP..&:..2..
00000240: 2acd 298a 5c8a f0c1 b99f e2ee 48a7 0a12  *.).\.......H...
00000250: 03b5 5cb3 0037 cece 773c 0200 00         ..\..7..w<...

このように、データはhexdump形式で記述されています。 hexdumpとは、データを16進数で表現したもので、ちょうど上のような表示形式を取るものです。

このhexdumpで記述されたデータを、xxdコマンドを使って読み出します。

NAME
  xxd - make a hexdump or do the reverse.
・・・
-r | -revert
  reverse operation

xxdとは、hexdumpを作成したり解読(リバース)したりするコマンドです。 -rオプションを使うとリバースすることができるようです。 さっそくやってみます。

$ xxd -r data.txt 
���6��@4bi���hBZh91AY&SY����������ϟ���������������׽��9��
     �mF�h�h44
D��B��,0�� ��4@�����@2C@h�� �
               �v;�P��;z�����s�!��+�f���̗�0`h�e�^���m��K�l��5n�+tÔhY���R�ɋ�^-K�����}�\,�ǿ�}E�F�_!r�U�g?E�i��9x��TB@�lȲ���BF.hM�SC4�V�F�

��\��WQO4�p�i�����S�#&��/߷�#ŀ��ՆF�<D�uԐ^_�H6.�-��wAt
                                                            �[��UP�G�CP��&:�2�*�)�\�������H�
�\�7��w<

このように、"人間には読めない"文字列が出てきてしまいました。 何が記述されているのか、検討もつきません。

そこで、この文字ファイルがどのようなファイルタイプなのか、調べることにします。 xxdコマンドで読み出した結果を別ファイルに出力し、fileコマンドでファイルタイプを見れば良いでしょう。

問題文で推奨されているように、新しい作業用ディレクトリ(/tmp/lain) を作成してdata.txtをコピーし、そこで作業することにします。

~$ mkdir /tmp/lain
~$ cp data.txt /tmp/lain
~$ cd /tmp/lain
/tmp/lain$ ls
data.txt

それでは、xxdコマンドで読み出し、ファイルタイプを調べます。

$ xxd -r data.txt > data_rev
$ file data_rev
data_rev: gzip compressed data, was "data2.bin", last modified: Tue Oct 16 12:00:23 2018, max compression, from Unix

どうやら、gzip圧縮されたファイル形式だったようです。 -d(decompress)オプションでgzipコマンドを実行し、ファイルを解凍します。

$ gzip -d data_rev
gzip: data_rev: unknown suffix -- ignored

接尾字がおかしい、と怒られてしましました。 そこで、gzipファイルの拡張子.gzをつけてから実行してみます。

$ cat data_rev > data_gz.gz
$ gzip -d data_gz.gz
$ ls
data_gz  data_rev  data.txt

解凍ファイルdata_gzが作成されました。 またファイルタイプを確認します。

$ file data_gz
data_gz: bzip2 compressed data, block size = 900k

今度はbzip2方式で圧縮されているようです。

まさに問題文にあったように、繰り返し圧縮されている、ということでしょう。 ここからは根気強く、ファイルタイプを調べては必要に応じて拡張子を変更し、圧縮方式にあった解凍を施していきます。

## 解凍2回目
$ cat data_gz > data_bz2.bz2    # bzip2の拡張子は .bz2
$ bzip2 -d data_bz2.bz2    # bzip2解凍
$ ls
data_bz2  data_gz  data_rev  data.txt

## 解凍3回目
$ file data_bz2
data_bz2: gzip compressed data, was "data4.bin", last modified: Tue Oct 16 12:00:23 2018, max compression, from Unix
$ cat data_bz2 > data_gz-2.gz
$ gzip -d data_gz-2.gz    # gzip2解凍
$ ls
data_bz2  data_gz  data_gz-2  data_rev  data.txt

## 解凍4回目
$ file data_gz-2
data_gz-2: POSIX tar archive (GNU)
$ cat data_gz-2 > data_tar.tar    # tarの拡張子は .tar
$ tar -xvf data_tar.tar    # tar解凍
data5.bin
$ ls
data5.bin  data_bz2  data_gz  data_gz-2  data_rev  data_tar.tar  data.txt

## 解凍5回目
$ file data5.bin
data5.bin: POSIX tar archive (GNU)
$ tar -xvf data5.bin     # tar解凍 (.binのままでも解凍できた)
data6.bin
$ ls
data5.bin  data_bz2  data_gz-2  data_tar.tar
data6.bin  data_gz   data_rev   data.txt

## 解凍6回目
$ file data6.bin
data6.bin: bzip2 compressed data, block size = 900k
$ cat data6.bin > data_bz2-2.bz2
$ bzip2 -d data_bz2-2.bz2     # bzip2解凍
$ ls
data5.bin  data_bz2    data_gz    data_rev      data.txt
data6.bin  data_bz2-2  data_gz-2  data_tar.tar

## 解凍7回目
$ file data_bz2-2
data_bz2-2: POSIX tar archive (GNU)
$ cat data_bz2-2 > data_tar2.tar
$ tar -xvf data_tar2.tar    # tar解凍
data8.bin
$ ls
data5.bin  data8.bin  data_bz2-2  data_gz-2  data_tar2.tar  data.txt
data6.bin  data_bz2   data_gz     data_rev   data_tar.tar

## 解凍8回目
$ file data8.bin
data8.bin: gzip compressed data, was "data9.bin", last modified: Tue Oct 16 12:00:23 2018, max compression, from Unix
$ cat data8.bin > data_gz-3.gz
$ gzip -d data_gz-3.gz    # gzip解凍
$ ls
data5.bin  data8.bin  data_bz2-2  data_gz-2  data_rev       data_tar.tar
data6.bin  data_bz2   data_gz     data_gz-3  data_tar2.tar  data.txt
$ file data_gz-3
data_gz-3: ASCII text

計8回の解凍を経て、ついに生のASCII textにたどり着くことができました。

$ cat data_gz-3
The password is 8ZjyCRiBWFYkneahHwxCv3wb2a1ORpYL

長い道のりでしたが、ようやくパスワードにありつきました。


Level 13 → Level 14

The password for the next level is stored in /etc/bandit_pass/bandit14 and can only be read by user bandit14. For this level, you don’t get the next password, but you get a private SSH key that can be used to log into the next level. Note: localhost is a hostname that refers to the machine you are working on

次のパスワードは、ユーザーbandit14にしか読み込めない/etc/bandit_pass/bandit14に入っています。 このレベルではパスワードが手に入らない代わりに、次のレベルにログインするためのSSH秘密鍵が手に入るそうです。

「次のレベルにログインするためのSSH秘密鍵」というのが、何を言っているのか私には分かりません。 問題文とともにヒントとして掲載してある次のページで、SSH秘密鍵でのログインについて調べてみます。

SSH/OpenSSH/Keys - Community Help Wiki

これによると、SSH鍵でのログインは、パスワードログインよりもより安全なログイン方法だそうです。

具体的に言うと、ログイン先PCの~/.ssh/authorized_keysにSSH公開鍵が登録され、それと対になるSSH秘密鍵が自身の~/.ssh/id_rsaに入っていれば、ログインが成功するという仕組みです。

つまり、SSH秘密鍵が手に入ったなら、~/.ssh/id_rsaを作成し、それに書き込めば良さそうです。

それではやっていきます。

$ ls
sshkey.private
$ cat sshkey.private 
-----BEGIN RSA PRIVATE KEY-----
MIIEpAIBAAKCAQEAxkkOE83W2cOT7IWhFc9aPaaQmQDdgzuXCv+ppZHa++buSkN+
gg0tcr7Fw8NLGa5+Uzec2rEg0WmeevB13AIoYp0MZyETq46t+jk9puNwZwIt9XgB
・
・中略
・
kAWpXbv5tbkkzbS0eaLPTKgLzavXtQoTtKwrjpolHKIHUz6Wu+n4abfAIRFubOdN
/+aLoRQ0yBDRbdXMsZN/jvY44eM+xRLdRVyMmdPtP8belRi2E2aEzA==
-----END RSA PRIVATE KEY-----

さっそくSSH秘密鍵が見つかりました。

自分のPC側に戻り、~/.ssh/id_rsaを作成してSSH秘密鍵をコピーペーストで追加します。

$ exit
logout
Connection to bandit.labs.overthewire.org closed.
$ cd .ssh
$ ls
known_hosts    # id_rsaはまだ存在しない
$ vim id_rsa
           # id_rsaを作成し、上記SSH秘密鍵をコピーペースト
$ ls
id_rsa  known_hosts
$ file id_rsa 
id_rsa: PEM RSA private key      # 秘密鍵として登録された

これで、~/.ssh/id_rsaにSSH秘密鍵が登録されたはずです。

bandit14へのログインを試みます。

$ ssh bandit14@bandit.labs.overthewire.org -p 2220
This is a OverTheWire game server. More information on http://www.overthewire.org/wargames

@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@
@         WARNING: UNPROTECTED PRIVATE KEY FILE!          @
@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@
Permissions 0644 for '/home/<user name>/.ssh/id_rsa' are too open.
It is required that your private key files are NOT accessible by others.
This private key will be ignored.

秘密鍵が守られていない、という警告が出され、秘密鍵が認証されませんでした。

パーミッションを確認してみると、

$ ls -l id_rsa 
-rw-r--r-- 1 user user 1680  5月  2 12:13 id_rsa

たしかに、オーナー以外にもファイルの読み込みが許可されています。

※パーミッションの読み方については、以前別記事に記録しました。 www.bioerrorlog.work

そこでchmodコマンドを用いて、オーナー以外のパーミッションを拒否します。

$ chmod 600 id_rsa      # オプションに600を与え、オーナー以外のパーミッションを拒否 (オーナーはrw)
$ ls -l id_rsa
-rw------- 1 user user 1680  5月  2 12:13 id_rsa

これでパーミッションも設定できました。

bandit14のログインにリベンジします。

$ ssh bandit14@bandit.labs.overthewire.org -p 2220
This is a OverTheWire game server. More information on http://www.overthewire.org/wargames
・
・
・
  Enjoy your stay!

bandit14@bandit:~$ 

みごと、ログインに成功しました。


Level 14 → Level 15

The password for the next level can be retrieved by submitting the password of the current level to port 30000 on localhost.

このレベルのパスワードを、ローカルホストのポート30000に送ることで、次のレベルのパスワードを回収することができる、とあります。

まずこのレベルのパスワードですが、Level13の問題文によると/etc/bandit_pass/bandit14にあるようです。

$ cat /etc/bandit_pass/bandit14
4wcYUJFw0k0XLShlDzztnTBHiqxU3b3e

あとはこのパスワードを、ローカルホストのポート30000に送ればいいのでしょう。 ちなみにローカルホストとは、いま作業しているPCのことです。

データを送るには、今回ncコマンドを使います。 マニュアルによると、

nc [destination] [port]       # destinationは"送り先"

この使い方で接続が確保できるようです。

このnc接続にパスワードを渡すことで、ローカルホスト/ポート30000にパスワードを送りつけます。

$ cat /etc/bandit_pass/bandit14 | nc localhost 30000
Correct!
BfMYroe26WYalil77FoDi9qh59eK5xNr

これで次のパスワードが入手できました。


Level 15 → Level 16

The password for the next level can be retrieved by submitting the password of the current level to port 30001 on localhost using SSL encryption.

このレベルのパスワードを、SSL暗号化した上でローカルホストのポート30001に送ることで、次のレベルのパスワードを回収することができる、とあります。

先程の問題と似ていますが、今度はSSL暗号をかける必要があるようです。

そこで今回はopenssl s_clientコマンドを使います。 マニュアルによると、

The s_client command implements a generic SSL/TLS client which connects
to a remote host using SSL/TLS. 

遠隔ホストにSSL/TLSを使って接続する、クライアントとして振る舞ってくれるようです。

使い方は、

openssl s_client [-connect host:port]

となっていました。

それでは、これでパスワードを渡してみます。

$ echo BfMYroe26WYalil77FoDi9qh59eK5xNr | openssl s_client -connect localhost:30001
CONNECTED(00000003)
・
・中略
・
---
DONE

接続には成功したようですが、何もこちらに返さずに終了してしまいました。

ここで問題文に付記してある注意書きを見てみると、

Helpful note: Getting “HEARTBEATING” and “Read R BLOCK”? Use -ign_eof and read the “CONNECTED COMMANDS” section in the manpage. Next to ‘R’ and ‘Q’, the ‘B’ command also works in this version of that command…

-ign_eofオプションを使いなさい、というアドバイスが載っています。 -ign_eofとは、マニュアルによると、

-ign_eof
  inhibit shutting down the connection when end of file is reached in
  the input.

入力まで処理が届いたときに、接続を切断するのを防ぐ、とあります。

入力に対して何か反応があるときには、-ign_eofを指定することでその反応を見ることができる、ということでしょうか。 さっそくやってみます。

$ echo BfMYroe26WYalil77FoDi9qh59eK5xNr | openssl s_client -connect localhost:30001 -ign_eof
CONNECTED(00000003)
・
・中略
・
---
Correct!
cluFn7wTiGryunymYOu4RcffSxQluehd

closed

見事、次のパスワードが返ってきました。


[関連記事] Pythonで鍵生成 - Keygen | リバースエンジニアリング入門#7


Level 16 → Level 17

The credentials for the next level can be retrieved by submitting the password of the current level to a port on localhost in the range 31000 to 32000. First find out which of these ports have a server listening on them. Then find out which of those speak SSL and which don’t. There is only 1 server that will give the next credentials, the others will simply send back to you whatever you send to it.

このレベルのパスワードをローカルホストに送りつければ、次の認証が得られるようです。 ただし、31000~32000の範囲の開いているポートを使う必要があります。 まず開いているポートを見つけ出してから、SSLを受け付けるポートを探し、それを使ってパスワードを送ります。

31000~32000の範囲の開いているポートを探すために、nmapコマンドを使いました。 マニュアルによると、

NAME
  nmap - Network exploration tool and security / port scanner
・・・
-p <port ranges>: Only scan specified ports
  Ex: -p22; -p1-65535;

nmapはポートスキャナーとしての機能を持っており、-pオプションでそのパート番号の範囲を指定できるようです。 さっそくやってみます。

$ nmap -p31000-32000 localhost

Starting Nmap 7.40 ( https://nmap.org ) at 2019-05-02 09:49 CEST
Nmap scan report for localhost (127.0.0.1)
Host is up (0.00020s latency).
Not shown: 998 closed ports
PORT      STATE SERVICE
31046/tcp open  unknown
31790/tcp open  unknown
31960/tcp open  unknown

開いているポートが3つ検出できました。

つぎは、この3つのポートのうちSSL対応しているものを探します。 これには前のレベルで使ったopenssl s_clientを利用しました。 SSLに対応できないポートなら、openssl s_clientでは接続できないはずです。 ポートを一つずつ試していきます。

$ openssl s_client -connect localhost:31046
CONNECTED(00000003)
140211373733120:error:141A10F4:SSL routines:ossl_statem_client_read_transition:unexpected message:../ssl/statem/statem_clnt.c:269:
---
no peer certificate available
---
No client certificate CA names sent
・
・以下略
・

1つめはエラーを吐きました。 SSL対応でなかったのでしょう。

次のポートを試します。

$ openssl s_client -connect localhost:31790
CONNECTED(00000003)
depth=0 CN = localhost
verify error:num=18:self signed certificate
verify return:1
depth=0 CN = localhost
verify return:1
---
Certificate chain
 0 s:/CN=localhost
   i:/CN=localhost
---
Server certificate
・
・中略
・
---

今度は接続に成功しました。 そして入力待機状態なので、このレベルのパスワードを打ち込みます。

cluFn7wTiGryunymYOu4RcffSxQluehd
Correct!
-----BEGIN RSA PRIVATE KEY-----
MIIEogIBAAKCAQEAvmOkuifmMg6HL2YPIOjon6iWfbp7c3jx34YkYWqUH57SUdyJ
imZzeyGC0gtZPGujUSxiJSWI/oTqexh+cAMTSMlOJf7+BrJObArnxd9Y7YT2bRPQ
Ja6Lzb558YW3FZl87ORiO+rW4LCDCNd2lUvLE/GL2GWyuKN0K5iCd5TbtJzEkQTu
・
・中略
・
blh9elyZ9FsGxsgtRBXRsqXuz7wtsQAgLHxbdLq/ZJQ7YfzOKU4ZxEnabvXnvWkU
YOdjHdSOoKvDQNWu6ucyLRAWFuISeXw9a/9p7ftpxm0TSgyvmfLF2MIAEwyzRqaM
77pBAoGAMmjmIJdjp+Ez8duyn3ieo36yrttF5NSsJLAbxFpdlc1gvtGCWW+9Cq0b
dxviW8+TFVEBl1O4f7HVm6EpTscdDxU+bCXWkfjuRb7Dy9GOtt9JPsX8MBTakzh3
vBgsyi/sN3RqRBcGU40fOoZyfAMT8s1m/uYv52O6IgeuZ/ujbjY=
-----END RSA PRIVATE KEY-----

こうして秘密鍵が手に入りました。

後は、この秘密鍵を用いて次のレベルにログインします。

私の場合~/.ssh/id_rsaにはLevel14の秘密鍵を書き込んであるので、今度は別名で秘密鍵を保存し、SSH接続時に-iオプションで指定するやり方をとってみます。

$ vim .ssh/bandit17_rsa
          # 入手した秘密鍵を記入
$ ssh bandit17@bandit.labs.overthewire.org -p 2220 -i .ssh/bandit17_rsa
                                                                                 # -i オプションで秘密鍵を指定
・
・中略
・

  Enjoy your stay!

bandit17@bandit:~$

これで、Level17へのログインに成功しました。


Level 17 → Level 18

There are 2 files in the homedirectory: passwords.old and passwords.new. The password for the next level is in passwords.new and is the only line that has been changed between passwords.old and passwords.new

passwords.newの中にある文字列のうち、passwords.oldとの差分がパスワードだそうです。

diffコマンドで差分を見ていきます。

$ ls
passwords.new  passwords.old
$ diff passwords.new passwords.old 
42c42
< kfBf3eYk5BPBRzwjqutbbfE887SVc5Yd
---
> hlbSBPAWJmL6WFDb06gpTx1pPButblOA

42c42とあるので、42行目が両者の違いとなっているようです。

そのうち1つめの引数に渡したpasswords.newにあった文字列は、---の上側にでてきた方となります。

つまり、kfBf3eYk5BPBRzwjqutbbfE887SVc5Ydがパスワードです。


Level 18 → Level 19

The password for the next level is stored in a file readme in the homedirectory. Unfortunately, someone has modified .bashrc to log you out when you log in with SSH.

次のパスワードはホームディレクトリのreadmeファイルの中にあります。 しかし、誰かが.bashrcファイルを書き換えてしまい、SSHでログインすると同時にログアウトするようになってしまいました、とのことです。

.bashrcとは、bash起動時に実行されるシェルスクリプトです。 たしかに、このLevel18にログインすると、次のように勝手にログアウトされてしまいます。

$ ssh bandit18@bandit.labs.overthewire.org -p 2220
・
・中略
・
  Enjoy your stay!

Byebye !
Connection to bandit.labs.overthewire.org closed.

そこで、sshコマンドを使って、ログインすることなくreadmeの中身を見ます。

sshコマンドは文末に別のコマンドを指定すると、ログインすることなく遠隔でそのコマンドを実行することができます。

ssh [user@]hostname [command]
・・・
If command is specified, it is executed on the remote host instead of a login shell.

さっそく試します。

$ ssh -p 2220 bandit18@bandit.labs.overthewire.org cat readme
This is a OverTheWire game server. More information on http://www.overthewire.org/wargames

bandit18@bandit.labs.overthewire.org's password: 
IueksS7Ubh8G3DCwVzrTd8rAVOwq3M5x

するとこのように、readmeに書かれていたパスワードを読み出すことができました。


Level 19 → Level 20

To gain access to the next level, you should use the setuid binary in the homedirectory. Execute it without arguments to find out how to use it. The password for this level can be found in the usual place (/etc/bandit_pass), after you have used the setuid binary.

次のレベルにアクセスするためには、ホームディレクトリにあるsetuidバイナリを使う必要があります。 引数なしで実行してみて、使い方を調べてください。 パスワードは/etc/bandit_passにあります、とのことです。

そもそもsetuidとは何でしょうか。 wikipediaによると、

setuid と setgid は、UNIXにおけるアクセス権を表すフラグの名称であり、ユーザーが実行ファイルを実行する際にその実行ファイルの所有者やグループの権限で実行できるようにする。それぞれ、set user ID と set group ID の略。一般ユーザーが高い特権レベルでしか実行できないタスクを一時的に実行できるようにする仕組みである。

setuid - Wikipedia

要は、一時的に権限を高めるための仕組みだそうです。

本来は見ることができない/etc/bandit_passの下にあるパスワードファイルを、setuidで得た権限のもとに閲覧しようというわけです。 さっそくやっていきます。

$ ls
bandit20-do
$ file bandit20-do 
bandit20-do: setuid ELF 32-bit LSB executable, Intel 80386, version 1 (SYSV), dynamically linked, interpreter /lib/ld-linux.so.2, for GNU/Linux 2.6.32, BuildID[sha1]=8e941f24b8c5cd0af67b22b724c57e1ab92a92a1, not stripped
$ ./bandit20-do 
Run a command as another user.
  Example: ./bandit20-do id

他のユーザーとしてコマンドを実行するには、./bandit20-do <command>とやれば良いようです。

このsetuid下で、/etc/bandit_pass下のパスワードファイルを見ます。

$ ./bandit20-do cat /etc/bandit_pass/bandit20
GbKksEFF4yrVs6il55v6gwY5aVje5f0j

パスワードを読み出すことができました。


おわりに

OverTheWire: Banditを、Level0からLevel10まで解いてみました。

[追記]Level20まで追加しました。

Bandit自体は、2019年4月現在Level34まであります。

sshで遠隔ログインしたことがなかったので初めは緊張しましたが、慣れてくると純粋に問題を楽しむことができました。 きれいにパスワードが特定できたときには、中々の興奮があります。

今回やったのは、コマンドの使い方を主軸に置いた入門用のCTFです。 これがもっと難しいものになれば、解いたときの快感は殊更でしょう。

ぜひこれからも遊んでいきたいものです。


参考

What is CTF? An introduction to security Capture The Flag competitions - YouTube

キャプチャー・ザ・フラッグ - Wikipedia

OverTheWire: Wargames


  1. 参考にした記事もいくつか書きました
    逆アセンブル解析 - gdb | リバースエンジニアリング入門#2 - 生物系がゼロから始めるTech Blog

  2. /dev/null discards unwanted output - Linux Shell Scripting Tutorial - A Beginner's handbook

  3. ちなみに>を使えば標準出力が、&>を使えば標準出力とエラー出力の両方がリダイレクトされます。

  4. Base64 - Wikipedia

  5. ROT13 - Wikipedia

Ghidraの使い方 | 初心者がリバースエンジニアリングツールGhidraを使ってみた

Ghidraの環境構築/インストールから、Ghidraの使い方とリバースエンジニアリングの実践までの記録を残します。


はじめに

おはよう。@bioerrorlogです。

2019年3月5日、NSA(アメリカ国家安全保障局)が、リバースエンジニアリングツール"Ghidra"を公開しました。 公開当日はえらいお祭り騒ぎで、YoutubeやTwitchではたくさんのセキュリティ系配信者がGhidraを使った生放送を行っていました。

そこで私も初心者ながら、ぜひGhidraを使ってみたいと思います。

目標は、Ghidraを使ってcrackmes.one1の簡単な問題をひとつ破ることです。

それではやっていきます。


作業環境

Ubuntu18.04.1 LTS を
Windows10の上に、VMwareによって構築した仮想環境で起動しています。
www.bioerrorlog.work


Ghidraの使い方

環境構築

Ghidraをインストールする

まずはサイトからGhidraをダウンロードします。

Ghidra

今回私がダウンロードした時点でのバージョンは、"ghidra_9.0"でした。 ダウンロードしたらzipを解凍して、さっそくインストール方法を調べました。

docsファイルのなかにInstallationGuide.htmlというものがあったので読んでみると、

To install Ghidra, simply extract the Ghidra distribution file to the desired filesystem destination using any unzip program

Ghidraをインストールするには、単にzipを解凍するだけで十分のようです。 これはとても簡単で良いですね。

多くのソフトウェアがインストール処理をする必要がある中、解凍だけで終わる方法は珍しい気がします。 Ghidraもこの方法のメリット、デメリットを認めていました。 メリットとしては、

On the up side, administrative privilege is not required to install Ghidra for personal use. Also, because installing Ghidra does not update any OS configurations such as the registry on Windows, removing Ghidra is as simple as deleting the Ghidra installation directory.

インストールに管理者権限が必要ないこと、OS設定を変更する必要がないこと、アンインストールが簡単なことが挙げられています。

一方デメリットとしては、

On the down side, Ghidra will not automatically create a shortcut on the desktop or appear in application start menus.

デスクトップやアプリケーションメニューにショートカットが自動で作成されないことが挙げられていました。


JDK(Java Development Kit)をインストールする

さて、InstallationGuide.htmlの先を読み進めると、JDK(Java Development Kit)のインストールが必要と書かれています。

Ghidra requires a supported version of a Java Runtime and Development Kit on the PATH to run.


JDKのインストール方法とPATHへの通し方も、丁寧に記載されていました。

Linux and macOS (OS X): Extract the JDK distribution (.tar.gz file) to your desired location, and add the JDK's bin directory to your PATH:

1. Extract the JDK:
        tar xvf <JDK distribution .tar.gz>  
2. Open ~/.bashrc with an editor of your choice. For example:  
        vi ~/.bashrc  
3. At the very end of the file, add the JDK bin directory to the PATH variable:  
        export PATH=<path of extracted JDK dir>/bin:$PATH  
4. Save file  
5. Restart any open terminal windows for changes to take effect  

このインストールガイドに従ってやっていきます。

まずは、JDKをダウンロードします。 GhidraがサポートされているJDKバージョンは、

Java 11 Runtime and Development Kit (JDK).OpenJDK distributed from jdk.java.net is suggested

JDK11がサポートしているようです。 jdk.javaから配布されているOpenJDK 11が推奨されていましたので、それをダウンロードしました。

JDK 11 Releases

それでは上記インストールガイドの手順1. JDKを解凍します。 インストールガイドに従い、tar xvfコマンドで解凍します。

$ tar xvf ./Downloads/openjdk-11.0.2_linux-x64_bin.tar.gz

これで、jdk-11.0.2がホームディレクトリに展開されました。

次は手順2~4. 環境PATHにJDKを通します。

やり方としては上記ガイドにならい、~/.bashrcファイルの最後の行にJDKのディレクトリを与えます。

#vimで~/.bashrcを開く

$ vim ~/.bashrc


#最後の行につぎの一行を書き加える

export PATH=~/jdk-11.0.2/bin:$PATH

これでファイルを保存すれば大丈夫です。

最後に手順5. 開いているターミナルをすべて閉じて、JDKのインストールは完了です。


[関連記事] 逆アセンブル解析 - gdb | リバースエンジニアリング入門#2


Ghidraを起動する

いよいよGhidraを起動します。 起動の仕方は、

Run ghidraRun.bat (Windows) or ghidraRun (Linux or macOS)

私はLinuxですのでghidraRunファイルを実行すればいいようです。 さっそく、ghidraの展開されたディレクトリに行き、実行してみます。

$ cd ghidra_9.0_PUBLIC_20190228/ghidra_9.0/
$ ./ghidraRun 

すると、見事Ghidraが起動しました。


Ghidraでファイルを開く

Crackmes.oneから問題をダウンロード/解凍

それでは、起動したGhidraを使ってCrackmes.oneの簡単な問題を解いていきます。 Crackmes.oneとは、リバースエンジニアリングするためのプログラムを投稿・ダウンロードできるサイトのようです。 合法的にリバースエンジニアリングで遊ぶことができます。

crackmes.one

ここから、次の簡単な問題"easy_reverse"をひとつダウンロードしました。

cbm-hackers's easy_reverse - Crackmes.one

そして、ダウンロードしたファイルを解凍したいのですが、ここでパスワードが要求されました。 焦らずに公式FAQ2を見てみると、

The password for the files is "crackmes.one". If it does not work, this is probably because the crackme has been imported from crackmes.de, so use the password "crackmes.de" instead.

パスワードは"crackmes.one"のようです。 これで、ファイルの解凍に成功しました。


Ghidraでバイナリファイルを開く

それでは、Ghidraでこのファイルを開きます。

はじめてGhidraを起動したときは3つのウィンドウ3が立ち上がりますが、いま重要なのは中くらいのウィンドウ:プロジェクトマネージャーだけです。 このプロジェクトマネージャーから、

File -> New Project

として、新しいプロジェクトを立ち上げます。

Non-Shared Project -> DirectoryとNameを記入 -> Finish

これで、新しいプロジェクトが立ち上がりました。

つぎに、先程ダウンロード/解凍したバイナリファイルをプロジェクトにインポートします。 やり方は簡単で、ウィンドウにバイナリファイルをドラッグするだけです。 ドラッグすると設定ウィンドウが開きますので、それぞれ適当な設定をして"OK"を押せばインポート完了です。 今回の場合ですと、"Format"は"Executable and Linking Format (ELF)"、"Language"は"x86:LE:64:dafault:gcc"としました。

インポートが完了したら、そのファイルをダブルクリックすることで解析ウィンドウを開くことができます。 解析ウィンドウを開くと、<ファイル名> has not been analyzed. Would you like to analyze it now?と聞かれるので、Yesとします。 すると、Analysis Optionsウィンドウが開いて多くのオプションが提示されますが、今回はとりあえずデフォルトのまま"Analyze"を押して先へ進みました。 これで、解析ができます(Fig. 1)。

ワクワクが高まってきました。

f:id:BioErrorLog:20190329085944p:plain
Fig. 1 Ghidraの解析ウィンドウ


リバースエンジニアリング実践

バイナリファイルの挙動を確認する

それではここから、さきほどCrackmes.oneからダウンロードした簡単な問題"rev50_linux64-bit"を破っていきます。

まずは、ターミナル上でこのバイナリファイルを実行し、挙動を見てみました。

$ ./rev50_linux64-bit 
USAGE: ./rev50_linux64-bit <password>
try again!

どうやら正しいパスワードを暴いて、このファイルを開かせるのが目的のようです。 さっそくGhidraで解析していきます。


[関連記事] radare2の使い方 | リバースエンジニアリング入門#5


Ghidraでmain関数をデコンパイルする

Ghidraでmain関数をデコンパイルして、中身を見ていきます。 この操作は簡単にできるようです。

Ghidraの左側にある小さなウィンドウ"Symbol Tree"の"Filter: "に"main"と打つと、Symbol Treeから"main"が抽出されます。 このなかで、"Functions"の中にある"main"をクリックすると、main関数の部分に移動します。 と同時に、右側にある"Decompile"ウィンドウには、C言語としてデコンパイルされたmain関数が表示されました。

undefined8 main(int iParm1,undefined8 *puParm2)

{
  size_t sVar1;
  
  if (iParm1 == 2) {
    sVar1 = strlen((char *)puParm2[1]);
    if (sVar1 == 10) {
      if (*(char *)(puParm2[1] + 4) == '@') {
        puts("Nice Job!!");
        printf("flag{%s}\n",puParm2[1]);
      }
      else {
        usage(*puParm2);
      }
    }
    else {
      usage(*puParm2);
    }
  }
  else {
    usage(*puParm2);
  }
  return 0;
}

頑張ればこのままでもアルゴリズムを読み出せそうですが、なかなか見慣れない表記が目立ちますので、一つずつ改変していきます。


コード表記を修正する

C言語のmain関数といえば、次のような形が普通でしょう。

int main(int argc,char *argv[])
{
~
}

それが、デコンパイルされたコードでは次のようになっています。

undefined8 main(int iParm1,undefined8 *puParm2)
{
~
}

これを修正します。

やり方は簡単です。 Ghidra上で修正したい部分を右クリックし、"Edit Function Signature"から書き換えます。 上に示したmain関数の冒頭部分を修正すると、main関数全体は次のように改変されました。

int main(int argc,char *argv[])

{
  size_t sVar1;
  
  if (argc == 2) {
    sVar1 = strlen(*(char **)(argv[] + 8));
    if (sVar1 == 10) {
      if (*(char *)(*(long *)(argv[] + 8) + 4) == '@') {
        puts("Nice Job!!");
        printf("flag{%s}\n",*(undefined8 *)(argv[] + 8));
      }
      else {
        usage(*(undefined8 *)argv[]);
      }
    }
    else {
      usage(*(undefined8 *)argv[]);
    }
  }
  else {
    usage(*(undefined8 *)argv[]);
  }
  return 0;
}

だいぶ見やすくなりましたが、まだ少し変な部分があります。

どうやらargv[]周辺の表記がおかしいようです4。 これを解決するため、配列表記*argv[]を、ポインタ表記**argvで代替します。

なぜこのように表記を代替できるのかについては、配列とポインタについての複雑な説明が必要になるので、割愛します。 次のサイトなどで分かりやすく解説されていました。
「ポインタのポインタ」と「ポインタの配列」の関係 - マイナビニュース

それでは、main関数冒頭部分int main(int argc,char * argv[])int main(int argc,char** argv)に変更し、再びmain関数全体を見渡します。

int main(int argc,char **argv)

{
  size_t sVar1;
  
  if (argc == 2) {
    sVar1 = strlen(argv[1]);
    if (sVar1 == 10) {
      if (argv[1][4] == '@') {
        puts("Nice Job!!");
        printf("flag{%s}\n",argv[1]);
      }
      else {
        usage(*argv);
      }
    }
    else {
      usage(*argv);
    }
  }
  else {
    usage(*argv);
  }
  return 0;
}

とても見やすくなりました。 このコードから、アルゴリズムを読み解いていきます。


アルゴリズムを解析する

どうやらmain関数の前半部分が重要に見えます。

int main(int argc,char **argv)

{
  size_t sVar1;
  
  if (argc == 2) {
    sVar1 = strlen(argv[1]);
    if (sVar1 == 10) {
      if (argv[1][4] == '@') {
        puts("Nice Job!!");
        printf("flag{%s}\n",argv[1]);
      }

まず、if (argc == 2)では、引数が一つ渡されているかどうかがチェックされています。 Trueだとその先の処理へ、Falseだと他の分岐でusage(*argv)へと飛ばされてしまいます。

よって、一つ目の条件は、

1. 引数がひとつ渡される

となるでしょう。


先にいきます。 次の認証は、

    sVar1 = strlen(argv[1]);
    if (sVar1 == 10) {
~
      }

となっています。 これは、sVar1 = strlen(argv[1])で引数の文字数を取得したあと、それが10であるかif (sVar1 == 10)がチェックされています。 つまり、2つめの条件は、

2. 引数は10文字の文字列

です。


最後の認証は、次の部分です。

      if (argv[1][4] == '@') {
        puts("Nice Job!!");
        printf("flag{%s}\n",argv[1]);

if (argv[1][4] == '@')の部分で、引数の5文字目5@であるかどうかをチェックしています。 この条件をクリアすれば、ついにflagが表示されるようです。


読み解いた認証アルゴリズムをまとめます。

1. 引数がひとつ渡される
2. 引数は10文字の文字列
3. 引数の4文字目は"@"

これで、このプログラムを破れるはずです。


[関連記事] 初心者が挑むCTF入門 | OverTheWire: Bandit Level 0~20


解いたパスワードでプログラムを破る

それでは、条件を満たすパスワード0123@56789で、ファイルを開いてみます。

$ ./rev50_linux64-bit 0123@56789
Nice Job!!
flag{0123@56789}

見事ファイルが開かれ、フラッグflag{0123@56789}を取ることができました。 Nice Job!!


おわりに

今回は、Ghidraのインストールと使い方、簡単なリバースエンジニアリングの実践方法を記しました。

使用したGhidraの機能はごく限定したもので、Ghidraには他にもたくさんの強力な機能が搭載されています。 とりあえず、Ghidraで何かをリバースしたいという目標は達成できました。

なお、今回扱ったCrackmes.oneの問題も、もっとも簡単なレベルのものです。 たくさんの問題が投稿されているので、色々挑戦していきたいと思っています。


参考

Ghidra quickstart & tutorial: Solving a simple crackme - YouTube

Ghidra

Crackmes

FAQ - Crackmes

cbm-hackers's easy_reverse - Crackmes.one

今こそ再考察! C言語ポインタ徹底解説 (3) | マイナビニュース


  1. Crackmes-リバースエンジニアリングするためのプログラムを投稿・ダウンロードできるサイト。もちろん合法的に、リバースエンジニアリングで遊ぶことができる。

  2. FAQ - Crackmes.one

  3. 小ウィンドウ: Tips、中ウィンドウ: プロジェクトマネージャー、大ウィンドウ: Help

  4. Ghidraでは配列表記[]での初期化が認識されないようです。

  5. 配列は0からはじまることに注意

Pythonで鍵生成 - Keygen | リバースエンジニアリング入門#7

鍵生成プログラムKeygenをPythonで作成します。 まずはradare2を用いてパスワード認証アルゴリズムを解析し、それを開くことができるKeygenを作成しました。


はじめに

おはよう。@bioerrorlogです。

前回は、ごく簡単な暗号アルゴリズムを用いてパスワード認証プログラム"your_pass_2"を作成しました。

www.bioerrorlog.work

今回は、このバイナリコードを自らリバースエンジニアリングして仕様を解析し、パスワード認証を通過できる鍵を生成する"Keygen"をPythonで作成します。

なお、内容はこのLiveOverflow氏の動画を参考に、自分で少し改変を加えつつ流れを再現するという形になります。

youtu.be


作業環境

Ubuntu18.04.1 LTS を
Windows10の上に、VMwareによって構築した仮想環境で起動しています。
www.bioerrorlog.work


Pythonで鍵生成

radare2でアルゴリズムを解析する

radare2でバイナリコード"your_pass_2"を逆アセンブルし、パスワード認証のアルゴリズムを解析します。 まずは、ビジュアルモードで着目すべき場所を探します。

なお、radare2の使い方については過去記事に詳しく記録しました。

www.bioerrorlog.work

それでは、さっそくradare2のビジュアルモードでmain関数を解析します。

$ r2 your_pass_2
~
> aaa
~
> s sym.main
> VV
Rendering graph...

ビジュアルモードの結果を入念に見ると、一箇所だけループ構造が発生していました(Fig. 1)。 ここを詳しく解析してみます。

f:id:BioErrorLog:20190223232422p:plain
Fig. 1 main関数で見られたループ部分のアセンブラコード構造

forループの特定

ループ構造として、まずはforループを疑ってみます。 これが典型的なforループならば、ループに入る前に0にセットされ、ループのたびに1ずつ増える変数(ループカウンタ" i ")があるはずです。 探してみると、ループ前に0にセットされている変数が2つありました(Fig. 1, ➀ブロック)。

mov dword [local_18h], 0 
mov dword [local_14h], 0

この2つの変数dword [local_18h]dword [local_14h]の行く末を見てみると、dword [local_14h]はループごとに1が加算されているのがわかります(Fig. 1, ➂ブロック)。

add dword [local_14h], 1 

ここからdword [local_14h]がループカウンタ" i "である期待が高まります。

つぎに、dword [local_14h]がループカウンタであれば、forループの終了条件に絡んでいるはずです。 そこでforループの分岐条件を辿ってみると(Fig. 1, ➁)、

mov eax, dword [local_14h]
~
movsxd rbx, eax
~
cmp rbx, rax
jb 0x723

dword [local_14h]eaxrbxと、分岐条件cmp rbx, raxに繋がっていました。

以上のことから、このループ構造はdword [local_14h]をループカウンタ" i "としたforループであると判断しました。

forループの処理を解析する

次に、forループ内の処理(Fig. 1, ➂ブロック)を解析しました。 とても複雑で難解なので、Cで書かれたソースコード1を書き置きます。

#include <string.h>
#include <stdio.h>

int main(int argc, char *argv[]) {
        if(argc==2) {
                printf("Checking Your Pass: %s\n", argv[1]);
                int sum = 0;
                for (int i=0; i<strlen(argv[1]); i++) {
                        sum += (int)argv[1][i];
                }
                if(sum==5345) {
                        printf("Hello, Master.\n");
                } else {
                        printf("Access Denied.\n");
                }

        } else {
                printf("Access Denied.\n");
        }
        return 0;
}

このソースコードによると、forループ内では、入力された文字argv[1]を一文字ずつint値として変数sumに加算していることがわかります。 この処理を、radare2で逆アセンブルしたコードから読み解きます。

forループ内(Fig. 1, ➂ブロック)は、

mov rax, qword [s]  
add rax, 8  
mov rdx, qword [rax] 
mov eax, dword [local_14h]
cdqe  
add rax, rdx   
movzx eax, byte [rax]    
movsx eax, al   
add dword [local_18h], eax
add dword [local_14h], 1

となっています。 最初から順に読み解いていきます


まず最初の2行に着目しました。

mov rax, qword [s]  
add rax, 8

レジスタraxに値が格納された後、8が加算されている点に注目します。 これは、raxが配列のアドレスを格納していることを示唆しています。

通常、64 bitコンピュータではメモリが8 byteずつに分割されています。 よって、1行目でraxに何かの配列のアドレスが格納された場合、2つ目の配列要素にアクセスしたいときにはraxに8を加算すればよい、というわけです。

ここで「2つ目の配列要素にアクセス」ということから考えられるのは、入力文字argv[1]でしょう。 argv[]配列は、プログラムの実行時に渡される引数を格納しています。 たとえばこのプログラム"your_pass_2"を、"Wrong-Pass"という文字列を渡して実行した場合、

$ ./your_pass_2 Wrong-Pass

argv[]配列は次のように格納されています。

./your_pass_2 Wrong-Pass
argv[0] argv[1]

よって、上記の2行は次のように解釈できそうです。

アセンブラコード レジスタの解釈
mov rax, qword [s] rax: argv[0]のアドレス
add rax, 8 rax: argv[1]のアドレス


では、次のコードに移ります

mov rdx, qword [rax] 
mov eax, dword [local_14h]
cdqe  
add rax, rdx   

前述の通り、raxargv[1]のアドレスを示しているので、1行目でrdxに格納されたのはargv[1]の中身を指すアドレスでしょう。 通常、先頭が指定されます。

アセンブラコード レジスタの解釈
mov rdx, qword [rax] rdx: argv[1]の中身の先頭を指すアドレス


次の行mov eax, dword [local_14h]では、dword [local_14h]が登場します。 これは、上述したようにforループで1ずつ増えるループカウンタです。 よってループカウンタの値がeaxに格納されるわけです。

その次の行cdqeは、eaxraxに設定する操作です2。 よって最後のadd rax, rdxは、先頭を指すアドレスrdxに、ループカウンタの値raxを足して、raxに格納しています。 ここまでをまとめると、

アセンブラコード レジスタの解釈
mov eax, dword [local_14h] eax: ループカウンタの値
cdqe rax: ループカウンタの値
add rax, rdx rax: 先頭アドレス+ループカウンタ


それでは最後の部分です。

movzx eax, byte [rax]    
movsx eax, al   
add dword [local_18h], eax

まずmovzx eax, byte [rax]で、raxの指し示すアドレスから1バイトを読み込んでいます。 この値はまさに入力文字のASCII値であると考えられます。 例えば、入力文字が"Wrong-Pass"で、ループカウンタが2の場合、

入力文字: W r o n g
ASCII値: 0x57 0x72 0x6F 0x6E 0x67
rax(rdx+ループカウンタ): rdx+1 rdx+2 rdx+3 rdx+4 rdx+5

eaxには"r"のASCII値0x72が格納されるというわけです。

次の行movsx eax, alでは、eaxの下位8ビット部分がeaxに再格納されています。 というのも、aleaxの下位8ビットを示すレジスタだからです3

そして最後には、add dword [local_18h], eaxeaxの値がdword [local_18h]に加算されています。 ここで、先に述べたようにdword [local_18h]は0で初期化された変数です。 つまり、ループごとにdword [local_18h]に入力文字が加算され、最後には入力文字の合計ASCII値の総和が格納されている、ということになります。


かなり長く複雑な解析をしてきました。 ここまでわかったforループの処理をまとめます。

アセンブラコード レジスタの解釈
mov rax, qword [s] rax: argv[0]のアドレス
add rax, 8 rax: argv[1]のアドレス
mov rdx, qword [rax] rdx: argv[1]の中身の先頭を指すアドレス
mov eax, dword [local_14h] eax: ループカウンタの値
cdqe rax: ループカウンタの値
add rax, rdx rax: 先頭アドレス+ループカウンタ
movzx eax, byte [rax] eax: 入力文字のASCII値
movsx eax, al eax: 下位8ビットを再格納
add dword [local_18h], eax dword [local_18h]: 入力文字ASCII値の総和


アクセス可否の判定条件

ここまで、forループ内で入力文字の総和dword [local_18h]が計算されていることを明らかにしました。 つぎは、この処理結果がどのようにしてアクセス可否の判定に使われているかを調べます。

これは簡単に分かりました。 forループ終了後の処理を見ると(Fig. 1, ➃)、次のようになっています。

cmp dword [local_18h], 0x14e1 
jne 0x778

つまり、入力文字の総和dword [local_18h]が0x14e1であるかどうかを判定し、プログラムが分岐しているわけです。

ついに、このプログラムの挙動が明らかになりました。 各入力文字ASCII値の総和が0x14e1であればアクセス承認、そうでなければアクセス拒否です。


Pythonで鍵生成 - Keygen

このパスワード認証プログラムの仕組みがわかったので、これを破るためのKeygenを作成します。 仕様は単純です。 ASCII値の総和が0x14e1となる文字列を自動生成するプログラムを、Pythonで書きます4

import random

#文字列keyの合計ASCII値を算出する関数
def check_key(key):
    char_sum = 0
    for c in key:
        char_sum += ord(c)
    return char_sum

#合計ASCII値が5345(0x14e1)である文字列を無限ループで生成
key = ""
while True:
    key += random.choice("abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789-_")
    s = check_key(key)
    if s > 5345:
        key = ""
    elif s == 5345:
        print ("Key: {0}".format(key))

さっそくこのPythonプログラム"keygen_your_pass_2.py"実行してみます。

$ python3 keygen_your_pass_2.py 
Key: 3beg-iCw2Xg7OP7E1xkn-HEaxai-KRl43pj5OkJuViZJnIozP9-q-XKOG7v0vWy6
Key: kI_MoMol9yqM6gImi2lyfVhNn6npOo7eRXxelQ4VHh88_BIfb5NtKvsyVHF1
Key: 9qFkJQVe74CTJz5EpF8h6E6bukw1XFYJ7YhndKM58SlymLooMra30RfgUUFUN5kK
Key: PLySl4Mu_eDoOaDQ7BV09K6WGrtOZFLP--pojSBFq8GPxIsgIxX_I0YkNQmBb8f7
Key: ui-IAbPFU2cR20ZMCMYSbyMqbuNpUqNutqwtll-YxeZx83KcI--u-PJF5B3RuAO
Key: ZL6AZgMIlphS0spzgWEsy_sFKusCS_46ahjGm2T7PQBf7h3ifrmytkX89s5z
Key: LfX9lEUp5vGDTVOlo2O7NyJQR_yne6Dd8BBTCQxfBleMmIz8RJPYYa9JuGpfdg
Key: 9yMjf2YKivb84KuhF6iLdvTssguiQne6kVKyjJvAvlV13qskhNgfLOHQBy6
Key: 5tzqUevjCYFoZ1lEnJWoIJJOHD4OMTv3qB5A3W2SBlHlhuXThrqksLV8FuHc-j
Key: _mcHUIbIM5QEAyGQOTqvpY-5TKsVBJEdGuT86fLcP3KrqAUH_fD1s0fR2JNqVS0NL
Key: 6t0pv0F3SbtKXwEjsp47xrfnC9zr2VjtqTOrTEYGcmwoRvpkdBT2bj_T6dO
Key: BjOLf49V_xPvaONmPyiyKoQAP0WYc3PNrq7VD-UQqT8I3otgILvmADOrGo3sDf
Key: nNBYpcTZAXdx8aXA5EUwSgXsKT2lcQpaH7JnuEuvmO2bvvXKNkSdwVPlkIm
Key: YnvH_JbZsDwKmJg7_fA4xnrn-UwM_d_N_G-xQS47wsOI5q12Cwc9hVIx_m3C3D
#以下略

即座に大量の鍵が生成されました。 ちなみに無限ループなので、処理を終了するには"Ctrl+c"を押す必要があります。

それでは、はたしてこれらの鍵でこのプログラム"your_pass_2"のアクセス承認が引き出せるのかを確かめます。

$ ./your_pass_2 A2viBkKm4IU-I_pEGF6-7YKONqAEk1Vl6KIAAg88fHKjFMN2DAqBjBvlwaqib-_xe5
Checking Your Pass: A2viBkKm4IU-I_pEGF6-7YKONqAEk1Vl6KIAAg88fHKjFMN2DAqBjBvlwaqib-_xe5
Hello, Master.

"Hello, Master."
見事、アクセス承認を引き出すことができました。


おわりに

今回は、radare2を用いてパスワード認証アルゴリズムを解析し、それに基づいてPythonで鍵生成プログラムKeygenを作成しました。

以前のようにデバッグ上でレジスタを操作する5のでなく、完全に外側からアクセスを開くのはなかなか趣深いものでした。

今回はソースコードを知っている状態で、かつ極めて簡単な暗号アルゴリズムをリバースしましたが、自分が知らないプログラムの解析にも挑戦してみたいです。 そういうことをするための安全なコミュニティがネット上にはたくさんある6ようなので、今後手を出していけたらと思っています。

[関連記事]

www.bioerrorlog.work

www.bioerrorlog.work

www.bioerrorlog.work


  1. パスワード認証の暗号化 | リバースエンジニアリング入門#6 - 生物系がゼロから始めるTech Blog

  2. Assembly Programming on x86-64 Linux (07)

  3. http://milkpot.sakura.ne.jp/note/x86.htmlより、"eax は rax の下位 32 ビット部分を指す。 また ax は eax の下位 16 ビット部分を指す。 さらに ax は上下 2 つの 8 ビットレジスタ ah, al に分割して使うことができる。"

  4. GitHub - LiveOverflow/liveoverflow_youtube: Material for the YouTube seriesを参考にしています。

  5. レジスタ操作でアクセス承認を引き出す - gdb | リバースエンジニアリング入門#3 - 生物系がゼロから始めるTech Blog

  6. 逆に、禁じられているソフトウェアを解析することは違法ですから、そこの一線は絶対に超えてはなりません。

パスワード認証の暗号化 | リバースエンジニアリング入門#6

ASCII値の合計を比較する簡単な暗号アルゴリズムを用いて、自らリバースエンジニアリングするためのパスワード認証プログラムを作成します。


はじめに

おはよう。@bioerrorlogです。

このリバースエンジニアリングシリーズの初回には、単純に入力文字と正規パスワードを比較するパスワード認証プログラムをCで作成しました。

www.bioerrorlog.work

#include <string.h>
#include <stdio.h>

int main(int argc, char *argv[]) {
        if(argc==2) {
                printf("Checking Your Pass: %s\n", argv[1]);
                if(strcmp(argv[1], "Antoine-Marie-Jean-Baptiste-Roger_comte-de-Saint-Exupery")==0) {
                        printf("Hello, Master.\n");
                } else {
                        printf("Access Denied.\n");
                }

        } else {
                printf("Access Denied.\n");
        }
        return 0;
}

前回まではこのCコードのバイナリコードを解析してきましたが、コード上に正規パスワードが直接記述されているため、stringsコマンドなどで簡単にパスワードを調べることができてしまいました1

そこで、今回は簡単な暗号アルゴリズムを用いて、パスワード認証プログラムをこれまでより少し破りにくいものに改良します2

作業環境

Ubuntu18.04.1 LTS を
Windows10の上に、VMwareによって構築した仮想環境で起動しています。
www.bioerrorlog.work


パスワード認証の暗号化

簡単な暗号アルゴリズム

ごく簡単な暗号アルゴリズムとして、パスワードのASCII3値の合計を比較するやり方を使用します。 たとえば、パスワードが"PASS"だった場合、

パスワード: P A S S 合計
ASCII値: 0x50 0x41 0x53 0x53 311

ASCII値の合計は10進数で311となります。 この値を正規パスワードと入力パスワードで比較することで、パスワードの認証を行います。

正規パスワードの合計ASCII値を算出する

それでは、正規パスワードのASCII値の合計を算出します。 上記のパスワード認証プログラムのソースコードでは、正規パスワードが"Antoine-Marie-Jean-Baptiste-Roger_comte-de-Saint-Exupery"となっています。 この正規パスワードのASCII値の合計を算出するために、次のようなCコード"ascii_sum.c"を書きました。

#include <string.h>
#include <stdio.h>

int main(int argc, char *argv[]) {
        if(argc==2) {
                int sum = 0;
                for (int i=0; i<strlen(argv[1]); i++) {
                        sum += (int)argv[1][i];
                }
                printf("ASCII sum: %d\n", sum);

        } else {
                printf("Usage: <key>\n");
        }
        return 0;
}

これで、引数に渡した文字列の合計ASCII値が出力されるはずです。 コンパイルしてから、試しに上に示した"PASS"を渡してみると、

$ ./ascii_sum PASS
ASCII sum: 311

正しく合計値311が表示され、プログラムが予想通りに機能することが伺えます。

そこで、正規パスワードのASCII合計値を調べると、

$ ./ascii_sum Antoine-Marie-Jean-Baptiste-Roger_comte-de-Saint-Exupery
ASCII sum: 5345

5345であることが分かりました。

パスワード認証プログラムを作成する

それでは、パスワード認証プログラムを変更して、渡された文字列の合計ASCII値を5345と比較することでアクセス可否を判断するプログラムに書き換えます。

#include <string.h>
#include <stdio.h>

int main(int argc, char *argv[]) {
        if(argc==2) {
        printf("Checking Your Pass: %s\n", argv[1]);
        int sum = 0;
                for (int i=0; i<strlen(argv[1]); i++) {
                        sum += (int)argv[1][i];
                }
        if(sum==5345) {
            printf("Hello, Master.\n");
        } else {
                    printf("Access Denied.\n");
            }

    } else {
        printf("Access Denied.\n");
    }
    return 0;
}

これを"your_pass_2.c"とし、コンパイルしてプログラムの挙動を確認します。

まずは間違ったパスワード"WRONG-PASS"を渡して実行します。

$ ./your_pass_2 WRONG-PASS
Checking Your Pass: WRONG-PASS
Access Denied.

予想通りにアクセスが拒否されました。

次に、正規パスワード"Antoine-Marie-Jean-Baptiste-Roger_comte-de-Saint-Exupery"を渡して実行します。

$ ./your_pass_2 Antoine-Marie-Jean-Baptiste-Roger_comte-de-Saint-Exupery
Checking Your Pass: Antoine-Marie-Jean-Baptiste-Roger_comte-de-Saint-Exupery
Hello, Master.

見事、アクセスが承認されました。 これで、ソースコードに直接正規パスワードを記述しない簡単なパスワード認証プログラムができました。


おわりに

今回は、ごく簡単な暗号アルゴリズムを用いて、パスワード認証プログラムを改良しました。

次回は、このバイナリコードをリバースエンジニアリングし、正解パスワードを生成する"Keygen"プログラムを作成します。

それにしても、少し調べてみると暗号アルゴリズムというものは大変奥が深そうです。 今回は可能な限り簡単なやり方をしましたが、現代においても暗号技術は一つの学問として日々研究成果が報告されています。

ハードウェアについてまるで知識がありませんが、たとえば量子コンピュータが飛躍的に高い性能で実現した場合、現在使われている暗号技術が解読可能になったりはしないのでしょうか。 仮に解読可能になった場合、この複雑にシステムが絡み合うIT社会の中で、新しい暗号技術への移行はスムーズに行えるものなのでしょうか。

妄想は膨らみます。

[関連記事]

www.bioerrorlog.work

www.bioerrorlog.work


  1. ハードコードされたパスワードを読み出す | リバースエンジニアリング入門#4 - 生物系がゼロから始めるTech Blogを参照。

  2. LiveOverflow氏の動画https://youtu.be/qS4VWL5R_OMを参考にしています。

  3. ASCIIとは、最もよく使用される文字コードです。数値と文字が対応したASCIIコードによって、コンピュータによる文字の表示を実現します。ASCIIコードは、ターミナルで$ man asciiとすることで見ることができます。

radare2の使い方 | リバースエンジニアリング入門#5

radare2のインストール方法から簡単な使い方までを記録しました。
直感では使いにくい面も感じましたが、使い慣れれば強力な武器となってくれるでしょう。

はじめに

おはよう。@bioerrorlogです。

これまでは、gdbやobjdumpコマンドなどを用いてバイナリコードのリバースエンジニアリングを試みてきました。

www.bioerrorlog.work

今回は、radare2という便利なツールを使ってバイナリコードを解析していきます。 radare2を使えば、バイナリコードの逆アセンブルからプログラム分岐の可視化、デバッグを一手に行うことができます。

さっそくやっていきます。

作業環境

Ubuntu18.04.1 LTS を
Windows10の上に、VMwareによって構築した仮想環境で起動しています。
www.bioerrorlog.work

radare2の使い方

radare2をインストールする

radare2をインストールするには、まず製作者のGitHubからradare2を"clone"1する必要があります。 そのために、まずはgit2をインストールします。

$ sudo apt install git

これでgitがインストールされました。

それではこのgitを使って、製作者のGitHubからradare2をcloneします。

$ git clone https://github.com/radare/radare2.git

cloneが終わったら、radare2の中に入ってインストールファイルを実行します。

$ cd radare2
$ ./sys/install.sh

すると、次のようなエラーを吐かれてしまいました。

You need GNU Make to build me

ビルドするには"GNU Make"が必要ですよと怒られてしまったわけです。
"GNU Make" とは、wikipediaによると、

makeは、プログラムのビルド作業を自動化するツール。コンパイル、リンク、インストール等のルールを記述したテキストファイル (makefile) に従って、これらの作業を自動的に行う。

いまいちよくわかりませんが、ビルドに必要なツールということで今は納得しておきます。 それではこのmakeをインストールします。

$ sudo apt install make

これでmakeがインストールされたので、radare2をインストールできるはずです。

$ ./sys/install.sh

すると、順調にインストールが進んだかに見えましたが、今度は次のエラーが表示されました。

~
ERROR: gcc cannot create executables

コンパイラであるgccが実行ファイルを作成できませんでした、とのことです。 それもそのはず、gccをまだインストールしていませんでした。 gccをインストールします。

$ sudo apt install gcc

これでgccもインストールされたので、今度こそradare2がインストールできるはずです。

$ ./sys/install.sh

長い処理の後、無事インストールが完了しました3

radare2を起動する

radare2を使って解析を始めるには、単純にバイナリコードをr2に渡してやれば良いです。 今回も、以前作成したパスワード認証プログラムのバイナリコード"your_pass"を解析します。

$ r2 your_pass
 -- Stop debugging me!
[0x000005d0]>

これでradare2による解析が開始しました。 >のあとにコマンドを入力することで操作することができます。

ちなみに、radare2を開始したときに表示されたコメント-- Stop debugging me!は、毎回変わります。 例えば、

-- Did you know that r2 is 10 years old?
 -- Heisenbug: A bug that disappears or alters its behavior when one attempts to probe or isolate it
 -- Please register your copy of r2 today! Only £29.90!

などなど。製作者のユーモアが感じられて私は好きです。

radare2の使い方を調べる | ? - ヘルプ

新しいツールを使い始めるときは、何よりもまず"使い方の調べ方"を知ることが大切です。 radare2では、?でヘルプを見ることができます。

> ?
Usage: [.][times][cmd][~grep][@[@iter]addr!size][|>pipe] ; ...   
Append '?' to any char command to get detailed help
Prefix with number to repeat command N times (f.ex: 3x)
| %var=value              alias for 'env' command
| *[?] off[=[0x]value]    pointer read/write data/values (see ?v, wx, wv)
| (macro arg0 arg1)       manage scripting macros
| .[?] [-|(m)|f|!sh|cmd]  Define macro or load r2, cparse or rlang file
| _[?]                    Print last output
| =[?] [cmd]              send/listen for remote commands (rap://, http://, <fd>)
| <[...]                  push escaped string into the RCons.readChar buffer
| /[?]                    search for bytes, regexps, patterns, ..
| ![?] [cmd]              run given command as in system(3)
| #[?] !lang [..]         Hashbang to run an rlang script
| a[?]                    analysis commands
| b[?]                    display or change the block size
| c[?] [arg]              compare block with given data
~
#以下略

上の方にAppend '?' to any char command to get detailed helpとあるように、更に詳細なヘルプを見るにはコマンドに再度?を付ければいいようです。 例えば、コマンドaの次に何のコマンドを追加すればいいかを調べたければ、a?とすればaに付け加えるべきコマンドが表示されます。

このようにしてヘルプを活用すれば、コマンドの意味を調べることができるわけです。 例えばコマンドaaaの意味をヘルプから調べるなら、

>?
~
| a[?]                    analysis commands
~

>a?
~
| aa[?]              analyze all (fcns + bbs) (aa0 to avoid sub renaming)
~

>aa?
~
| aaa[?]              autoname functions after aa (see afna)
~

つまり、aaaは"autoname function"を"すべて" "解析"するコマンドである、ということになります。

ここまでは下準備です。 次はさっそく解析を始めていきます。

使用される関数を表示する | afl

aflコマンドを打つことで、解析しているバイナリコードで使用される関数のリストを表示させることができます。

その前にまずradare2を開始したら、私はaaaで関数を解析させるようにしています。

>aaa
[x] Analyze all flags starting with sym. and entry0 (aa)
[x] Analyze function calls (aac)
[x] Analyze len bytes of instructions for references (aar)
[x] Constructing a function name for fcn.* and sym.func.* functions (aan)
[x] Type matching analysis for all functions (afta)
[x] Use -AA or aaaa to perform additional experimental analysis.

そしたら、使用されている関数をaflで表示させます。

> afl
0x00000000    6 292  -> 318  sym.imp.__libc_start_main
0x00000560    3 23           sym._init
0x00000590    1 6            sym.imp.puts
0x000005a0    1 6            sym.imp.printf
0x000005b0    1 6            sym.imp.strcmp
0x000005c0    1 6            sub.__cxa_finalize_5c0
0x000005d0    1 43           entry0
0x00000600    4 50   -> 40   sym.deregister_tm_clones
0x00000640    4 66   -> 57   sym.register_tm_clones
0x00000690    5 58   -> 51   sym.__do_global_dtors_aux
0x000006d0    1 10           entry.init0
0x000006da    6 129          main
0x00000760    3 101  -> 92   sym.__libc_csu_init
0x000007d0    1 2            sym.__libc_csu_fini
0x000007d4    1 9            sym._fini

たくさんの面白そうな関数名が表示されました。 ここから、putsprintfstrcmp関数などが使われていることがわかるわけです。

逆アセンブル | pdf

つぎに、main関数の逆アセンブルを行います。 まずは、sコマンドでmain関数に移動します。

[0x000005d0]> s sym.main 
[0x000006da]> 

>の前の文字列[0x000005d0]は現在の位置を示しており、main関数の開始地点[0x000006da]に移動したことがわかります。 ここでpdfと打つことによって、逆アセンブルを行うことができます。

[0x000006da]> pdf
/ (fcn) main 129
|   main (int argc, char **argv, char **envp);
|           ; var char **s1 @ rbp-0x10
|           ; var unsigned int local_4h @ rbp-0x4
|           ; arg unsigned int argc @ rdi
|           ; arg char **argv @ rsi
|           ; DATA XREF from entry0 (0x5ed)
|           0x000006da      55             push rbp
|           0x000006db      4889e5         mov rbp, rsp
|           0x000006de      4883ec10       sub rsp, 0x10
|           0x000006e2      897dfc         mov dword [local_4h], edi   ; argc
|           0x000006e5      488975f0       mov qword [s1], rsi         ; argv
|           0x000006e9      837dfc02       cmp dword [local_4h], 2
|       ,=< 0x000006ed      7559           jne 0x748
|       |   0x000006ef      488b45f0       mov rax, qword [s1]
|       |   0x000006f3      4883c008       add rax, 8
|       |   0x000006f7      488b00         mov rax, qword [rax]
|       |   0x000006fa      4889c6         mov rsi, rax
|       |   0x000006fd      488d3de40000.  lea rdi, str.Checking_Your_Pass:__s ; 0x7e8 ; "Checking Your Pass: %s\n" ; const char *format
|       |   0x00000704      b800000000     mov eax, 0
|       |   0x00000709      e892feffff     call sym.imp.printf         ; int printf(const char *format)
|       |   0x0000070e      488b45f0       mov rax, qword [s1]
|       |   0x00000712      4883c008       add rax, 8
|       |   0x00000716      488b00         mov rax, qword [rax]
|       |   0x00000719      488d35e00000.  lea rsi, str.Antoine_Marie_Jean_Baptiste_Roger_comte_de_Saint_Exupery ; 0x800 ; "Antoine-Marie-Jean-Baptiste-Roger_comte-de-Saint-Exupery" ; const char *s2
|       |   0x00000720      4889c7         mov rdi, rax                ; const char *s1
|       |   0x00000723      e888feffff     call sym.imp.strcmp         ; int strcmp(const char *s1, const char *s2)
|       |   0x00000728      85c0           test eax, eax
|      ,==< 0x0000072a      750e           jne 0x73a
|      ||   0x0000072c      488d3d060100.  lea rdi, str.Hello__Master. ; 0x839 ; "Hello, Master." ; const char *s
|      ||   0x00000733      e858feffff     call sym.imp.puts           ; int puts(const char *s)
|     ,===< 0x00000738      eb1a           jmp 0x754
|     |||   ; CODE XREF from main (0x72a)
|     |`--> 0x0000073a      488d3d070100.  lea rdi, str.Access_Denied. ; 0x848 ; "Access Denied." ; const char *s
|     | |   0x00000741      e84afeffff     call sym.imp.puts           ; int puts(const char *s)
|     |,==< 0x00000746      eb0c           jmp 0x754
|     |||   ; CODE XREF from main (0x6ed)
|     ||`-> 0x00000748      488d3df90000.  lea rdi, str.Access_Denied. ; 0x848 ; "Access Denied." ; const char *s
|     ||    0x0000074f      e83cfeffff     call sym.imp.puts           ; int puts(const char *s)
|     ||    ; CODE XREFS from main (0x738, 0x746)
|     ``--> 0x00000754      b800000000     mov eax, 0
|           0x00000759      c9             leave
\           0x0000075a      c3             ret

プログラムの分岐を示す矢印や、ハードコードされた文字列( "Hello, Master." など)が表示されており、以前gdbで逆アセンブルしたときより圧倒的に多くの情報が得られました。

Visualモードでプログラムの流れを表示する | VV

Visualモードを使うことによって、プログラムの流れを表示させることができます。 Visualモードに移るにはVVと打ちます。

[0x000006da]> VV

すると、次のようなプログラムの流れが表示されます(Fig. 1)。

f:id:BioErrorLog:20190211135605p:plain
Fig. 1 Visualモードのスクリーンショット

Visualモードで実行できることは、"?"キーを押すことで調べることができます。 例えば"p"を押せば表示モードの変更、矢印キーで画面のスクロール、"tab"キーで選択ノード4の変更、などなど。 特に、色合いを変更できる"R"は面白い機能でした5

デバッグモードで解析する | -d / ood

radare2では、gdbのようにデバッグモードで解析を行うことができます。

改めてデバッグモードでradara2を起動するには、一旦"q"あるいは"^D"(Ctrl + d)を押してradare2を終了します。 そしたら、デバッグモードでradare2を起動するため、-dを渡してバイナリコード”your_pass”の解析を開始します。

$ r2 -d your_pass

あるいは、radare2上でコマンドoodを打てば、デバッグモードで開き直すことができます。

>ood

次に、gdbでデバッグするときと同じように、main関数の開始地点にブレークポイントを設置します。 main関数のアドレスは、上述したのと同じ手順で確認します。 しかしここで、aaaで解析すると何故かうまく行きませんでした。 代わりにaaで解析するとうまく行きました。 ここららへんの細かいところは正直まだ理解できていないので、今後扱い慣れていきたいものです。

>aa
~
>s sym.main
~
>pdf
/ (fcn) main 129
|   main (int argc, char **argv, char **envp);
|           ; var int local_10h @ rbp-0x10
|           ; var int local_4h @ rbp-0x4
|           ; arg int argc @ bp
|           ; arg char **argv @ r15b
|           ; DATA XREF from entry0 (0x55e86a7d05ed)
|           0x55e86a7d06da      55             push rbp
|           0x55e86a7d06db      4889e5         mov rbp, rsp
|           0x55e86a7d06de      4883ec10       sub rsp, 0x10
~
#以下略

main関数の先頭のアドレスが0x55e86a7d06daであることが分かりました。 それではdbコマンドでブレークポイントを設置します。

> db 0x55e86a7d06da

では、さっそくVVでVisualモードに移行し、デバッグを開始します。

Visualモードでは、vimのように” : ”を押すことでコマンドを受け付けるようになります。 " : "を押したあと、"dc"コマンドでプログラムを実行させます

:> dc
hit breakpoint at: 0x55e86a7d06da

ブレークポイントに到達したら、"Shift + s"で1ステップずつ実行していきます。 処理している現在のアドレスは;-- rip:6によって示されます(Fig. 2)。

f:id:BioErrorLog:20190211162736p:plain
Fig. 2 ";--rip:"が1ステップずつ進んでいく

細かい機能はもちろんたくさんありますが、とりあえず以上のようにして、デバッグを行うことができます。


おわりに

今回は、radare2の使い方を記録しました。

これまでgdbをつかって自力でやっていたことを自動化できるため、大変強力なツールだと感じました。 また、随所にみられる製作者の遊び心には趣深いものがあります。 ただ、挙動や機能に慣れていないせいか、直感では使いづらい面もありました。 ほかにも類似のツールはたくさんあるのでしょうが、それでもとりあえずはこのradare2で遊んでいきたいと思っています。

[関連記事]

www.bioerrorlog.work

www.bioerrorlog.work

www.bioerrorlog.work

参考

Simple Tools and Techniques for Reversing a binary - bin 0x06 - YouTube

メイク - Wikipedia


  1. cloneとは、製作者の公開するソフトウェア(正しくはリポジトリ)を自分のPCに複製することを言います。

  2. gitはバージョン管理システムです。GitHubはこのgitを利用して、ソフトウェア開発者が自分のソフトウェアを公開できる有名なプラットフォームです。

  3. こんなにもエラーが多かった理由は、新しく仮想環境で立ち上げた、生まれたてのUbuntuで再度インストールを行ったからです。ふつうはmakeやgccは既にインストールしたことがあるでしょうから、こんなに躓くことはないでしょう。

  4. 選択ノードは青枠で表示されます。

  5. 実に多様で美しい色彩が実装されています。製作者の遊び心でしょうか。

  6. “rip"は処理中のアドレスを指し示すレジスタの名前です。

ハードコードされたパスワードを読み出す | リバースエンジニアリング入門#4

stringsコマンドやobjdumpコマンドを用いて、プログラム中の正規パスワードを読み出す方法の記録を残します。


はじめに

おはよう。@bioerrorlogです。

前回は、gdbを用いてアセンブラコードを詳細に解析し、レジスタを操作してパスワード認証過程をスキップさせました。 www.bioerrorlog.work

今回は、プログラムに書かれたパスワードを読み出す方法をいくつか記録します。


作業環境

Ubuntu18.04.1 LTS を
Windows10の上に、VMwareによって構築した仮想環境で起動しています。
www.bioerrorlog.work


ハードコードされたパスワードを読み出す

コード中の文字列からパスワードを読む | strings

stringsコマンドは、マニュアルによると、

NAME
       strings - print the strings of printable characters in files.

ファイルに記述された文字列を表示させることができます。 これは、テキストファイルではないファイルに対して有用です。 テキストファイルであれば普通に中身を見れば良いのですが、例えばバイナリファイルでは大部分が表示可能な文字列ではないため1stringsによって読める文字列を抽出させることができます。 その中に運良くそのままパスワードが記載されていれば、儲けものです。

さっそく、バイナリコード"your_pass"をstringsに渡してみます。

$ strings your_pass
/lib64/ld-linux-x86-64.so.2
libc.so.6
puts
printf
__cxa_finalize
strcmp
__libc_start_main
GLIBC_2.2.5
_ITM_deregisterTMCloneTable
__gmon_start__
_ITM_registerTMCloneTable
=y   
=W   
=Z   
AWAVI
AUATL
[]A\A]A^A_
Checking Your Pass: %s
Antoine-Marie-Jean-Baptiste-Roger_comte-de-Saint-Exupery
Hello, Master.
Access Denied.
;*3$"
GCC: (Ubuntu 7.3.0-27ubuntu1~18.04) 7.3.0
crtstuff.c
deregister_tm_clones
__do_global_dtors_aux
completed.7696
__do_global_dtors_aux_fini_array_entry
frame_dummy
__frame_dummy_init_array_entry
your_pass.c
__FRAME_END__
__init_array_end
_DYNAMIC
__init_array_start
__GNU_EH_FRAME_HDR
_GLOBAL_OFFSET_TABLE_
__libc_csu_fini
_ITM_deregisterTMCloneTable
puts@@GLIBC_2.2.5
_edata
printf@@GLIBC_2.2.5
__libc_start_main@@GLIBC_2.2.5
__data_start
strcmp@@GLIBC_2.2.5
__gmon_start__
__dso_handle
_IO_stdin_used
__libc_csu_init
__bss_start
main
__TMC_END__
_ITM_registerTMCloneTable
__cxa_finalize@@GLIBC_2.2.5
.symtab
.strtab
.shstrtab
.interp
.note.ABI-tag
.note.gnu.build-id
.gnu.hash
.dynsym
.dynstr
.gnu.version
.gnu.version_r
.rela.dyn
.rela.plt
.init
.plt.got
.text
.fini
.rodata
.eh_frame_hdr
.eh_frame
.init_array
.fini_array
.dynamic
.data
.bss
.comment

長々とした面白そうな文字列が表示されました。 どれも興味深いですが、今回着目すべきはハードコーディング2されたパスワードの文字列です。 つぎの部分が怪しい香りがします。

~
Checking Your Pass: %s
Antoine-Marie-Jean-Baptiste-Roger_comte-de-Saint-Exupery
Hello, Master.
Access Denied.
~

ここで、Checking Your Pass: %sHello, Master.Access Denied.はパスワード認証プログラムとしては有り得そうな文字列ですが、Antoine-Marie-Jean-Baptiste-Roger_comte-de-Saint-Exuperyは文脈に合わない謎の文字列です。 これこそパスワードである可能性があります。 さっそくこの文字列をバイナリコードに渡して実行してみます。

$ ./your_pass Antoine-Marie-Jean-Baptiste-Roger_comte-de-Saint-Exupery
Checking Your Pass: Antoine-Marie-Jean-Baptiste-Roger_comte-de-Saint-Exupery
Hello, Master.

見事、アクセスが承認されました。 まさしくこれがパスワードだったようです。

.rodataセクションからパスワードを読む | objdump -x / gdb

objdumpコマンドに-xオプションを渡して実行すると、すべてのヘッダー情報が表示されます。 ヘッダーはどれも面白そうな情報でいっぱいですが、今回は"Sections"の欄に着目します。

$ objdump -x your_pass
~
~
Sections:
Idx Name          Size      VMA               LMA               File off  Algn
  0 .interp       0000001c  0000000000000238  0000000000000238  00000238  2**0
                  CONTENTS, ALLOC, LOAD, READONLY, DATA
  1 .note.ABI-tag 00000020  0000000000000254  0000000000000254  00000254  2**2
                  CONTENTS, ALLOC, LOAD, READONLY, DATA
  2 .note.gnu.build-id 00000024  0000000000000274  0000000000000274  00000274  2**2
                  CONTENTS, ALLOC, LOAD, READONLY, DATA
  3 .gnu.hash     0000001c  0000000000000298  0000000000000298  00000298  2**3
                  CONTENTS, ALLOC, LOAD, READONLY, DATA
  4 .dynsym       000000d8  00000000000002b8  00000000000002b8  000002b8  2**3
                  CONTENTS, ALLOC, LOAD, READONLY, DATA
  5 .dynstr       00000090  0000000000000390  0000000000000390  00000390  2**0
                  CONTENTS, ALLOC, LOAD, READONLY, DATA
  6 .gnu.version  00000012  0000000000000420  0000000000000420  00000420  2**1
                  CONTENTS, ALLOC, LOAD, READONLY, DATA
  7 .gnu.version_r 00000020  0000000000000438  0000000000000438  00000438  2**3
                  CONTENTS, ALLOC, LOAD, READONLY, DATA
  8 .rela.dyn     000000c0  0000000000000458  0000000000000458  00000458  2**3
                  CONTENTS, ALLOC, LOAD, READONLY, DATA
  9 .rela.plt     00000048  0000000000000518  0000000000000518  00000518  2**3
                  CONTENTS, ALLOC, LOAD, READONLY, DATA
 10 .init         00000017  0000000000000560  0000000000000560  00000560  2**2
                  CONTENTS, ALLOC, LOAD, READONLY, CODE
 11 .plt          00000040  0000000000000580  0000000000000580  00000580  2**4
                  CONTENTS, ALLOC, LOAD, READONLY, CODE
 12 .plt.got      00000008  00000000000005c0  00000000000005c0  000005c0  2**3
                  CONTENTS, ALLOC, LOAD, READONLY, CODE
 13 .text         00000202  00000000000005d0  00000000000005d0  000005d0  2**4
                  CONTENTS, ALLOC, LOAD, READONLY, CODE
 14 .fini         00000009  00000000000007d4  00000000000007d4  000007d4  2**2
                  CONTENTS, ALLOC, LOAD, READONLY, CODE
 15 .rodata       00000077  00000000000007e0  00000000000007e0  000007e0  2**3
                  CONTENTS, ALLOC, LOAD, READONLY, DATA
 16 .eh_frame_hdr 0000003c  0000000000000858  0000000000000858  00000858  2**2
                  CONTENTS, ALLOC, LOAD, READONLY, DATA
 17 .eh_frame     00000108  0000000000000898  0000000000000898  00000898  2**3
                  CONTENTS, ALLOC, LOAD, READONLY, DATA
 18 .init_array   00000008  0000000000200da8  0000000000200da8  00000da8  2**3
                  CONTENTS, ALLOC, LOAD, DATA
 19 .fini_array   00000008  0000000000200db0  0000000000200db0  00000db0  2**3
                  CONTENTS, ALLOC, LOAD, DATA

ここで一番面白そうなのは、15 .rodataセクションです。 これは"read only data"のセクションを指し示しており、コードに書かれた文字列もここに格納されています。 数字列の意味するところは、

Idx Name          Size      VMA               LMA               File off  Algn
~
 15 .rodata       00000077  00000000000007e0  00000000000007e0  000007e0  2**3
                  CONTENTS, ALLOC, LOAD, READONLY, DATA

アドレス0x7e0を開始点として、長さ0x077分のセクションが.rodataセクションである、ということです。 こいつはなかなか面白そうです。

前回、プログラムを解析するなかで、strcmp関数が正規のパスワードと入力された文字列を比較することによって、下流のルート分岐が制御されていることが分かりました。 つまり、このstrcmp関数が実行される時、どれかのレジスタに正規パスワードが格納されていることが予想されます。 そして、そのレジスタはまさしく.rodataセクションを参照していると考えられるわけです。 そのレジスタの中身を覗いてやれば、正規パスワードを表示させることができるでしょう。 さっそくgdbで試してみます。

strcmp関数が呼び出されるところにブレークポイントを設定し、そこまでプログラムを進めたら、レジスタの中身を見てみます。

(gdb) info registers
rax            0x7fffffffe30a  140737488347914
rbx            0x0 0
rcx            0x0 0
rdx            0x0 0
rsi            0x555555554800  93824992233472
rdi            0x7fffffffe30a  140737488347914
rbp            0x7fffffffde80  0x7fffffffde80
rsp            0x7fffffffde70  0x7fffffffde70
r8             0x0 0
r9             0x7 7
r10            0xfffffff9  4294967289
r11            0x246   582
r12            0x5555555545d0  93824992232912
r13            0x7fffffffdf60  140737488346976
r14            0x0 0
r15            0x0 0
rip            0x555555554723  0x555555554723 <main+73>
eflags         0x212   [ AF IF ]
cs             0x33    51
ss             0x2b    43
ds             0x0 0
es             0x0 0
fs             0x0 0
gs             0x0 0

アドレスの5555555547fffffffdは無視し、下3桁に注目します3。 .rodataセクションは0x7e0から0x857の範囲なので4、この範囲を参照しているレジスタはrsiの0x800のみであることがわかります。 それではx/sコマンドでレジスタの中身を見てみます。

(gdb) x/s 0x555555554800
0x555555554800:    "Antoine-Marie-Jean-Baptiste-Roger_comte-de-Saint-Exupery"

見事、正規のパスワード"Antoine-Marie-Jean-Baptiste-Roger_comte-de-Saint-Exupery"が表示されました。


おわりに

今回は、プログラムに書かれたパスワードを読み出す方法5を記録しました。

こうしてみると、ソースコードに重要な情報を書き込むことは自殺行為であるということを身に染みて感じます。 なにも難しい技術を使うことなく、コード中の文字列を読むことができます。

ではどのようにプログラムを書けば安全なのでしょうか。 これもまた難しい問題であり、面白いトピックなのでしょう。

[関連記事]

www.bioerrorlog.work

www.bioerrorlog.work


  1. 例えばvimでバイナリコードを開いてみると、大部分が@^@^R^@^@^@^@^@^@^@^@^@^@^@^@^@^@のように表示されます。これは、ASCIIが対応していない範囲の値が読み込まれたことが原因でしょう。

  2. ハードコーディング - Wikipedia

  3. 前回の記事でもこのアドレスを占める数字について触れましたが、いまだに何を意味しているのかよく分かりません。とても気になります。

  4. 16進数の計算は、pythonで>>> hex(0x7e0 + 0x077)のようにやると簡単にできました。

  5. Simple Tools and Techniques for Reversing a binary - bin 0x06 - YouTubeに多くを参考させていただきました。

レジスタ操作でアクセス承認を引き出す - gdb | リバースエンジニアリング入門#3

gdbを用いてプログラムの各ステップを解析・操作することで、アクセス承認を目指します。


はじめに

おはよう。@bioerrorlogです。

前回は、アセンブラコードを解析してプログラムの流れを把握しました。
www.bioerrorlog.work 具体的には、次のアセンブラコードから、全体の流れ図(Fig. 1)を書き出しました。

Dump of assembler code for function main:
   0x00000000000006da <+0>:  push   rbp
   0x00000000000006db <+1>:  mov    rbp,rsp
   0x00000000000006de <+4>:  sub    rsp,0x10
   0x00000000000006e2 <+8>:  mov    DWORD PTR [rbp-0x4],edi
   0x00000000000006e5 <+11>: mov    QWORD PTR [rbp-0x10],rsi
   0x00000000000006e9 <+15>: cmp    DWORD PTR [rbp-0x4],0x2
   0x00000000000006ed <+19>: jne    0x748 <main+110>
   0x00000000000006ef <+21>: mov    rax,QWORD PTR [rbp-0x10]
   0x00000000000006f3 <+25>: add    rax,0x8
   0x00000000000006f7 <+29>: mov    rax,QWORD PTR [rax]
   0x00000000000006fa <+32>: mov    rsi,rax
   0x00000000000006fd <+35>: lea    rdi,[rip+0xe4]        # 0x7e8
   0x0000000000000704 <+42>: mov    eax,0x0
   0x0000000000000709 <+47>: call   0x5a0 <printf@plt>
   0x000000000000070e <+52>: mov    rax,QWORD PTR [rbp-0x10]
   0x0000000000000712 <+56>: add    rax,0x8
   0x0000000000000716 <+60>: mov    rax,QWORD PTR [rax]
   0x0000000000000719 <+63>: lea    rsi,[rip+0xe0]        # 0x800
   0x0000000000000720 <+70>: mov    rdi,rax
   0x0000000000000723 <+73>: call   0x5b0 <strcmp@plt>
   0x0000000000000728 <+78>: test   eax,eax
   0x000000000000072a <+80>: jne    0x73a <main+96>
   0x000000000000072c <+82>: lea    rdi,[rip+0x107]        # 0x83a
   0x0000000000000733 <+89>: call   0x590 <puts@plt>
   0x0000000000000738 <+94>: jmp    0x754 <main+122>
   0x000000000000073a <+96>: lea    rdi,[rip+0x108]        # 0x849
   0x0000000000000741 <+103>:    call   0x590 <puts@plt>
   0x0000000000000746 <+108>:    jmp    0x754 <main+122>
   0x0000000000000748 <+110>:    lea    rdi,[rip+0xfa]        # 0x849
   0x000000000000074f <+117>:    call   0x590 <puts@plt>
   0x0000000000000754 <+122>:    mov    eax,0x0
   0x0000000000000759 <+127>:    leave  
   0x000000000000075a <+128>:    ret    
End of assembler dump.

f:id:BioErrorLog:20190202175344j:plain
Fig. 1 アセンブラコードから解析したプログラムの流れ
今回は、gdbのデバッグ機能を利用してそれぞれのステップを解析し、パスワード認証過程の特定と迂回を目指します。


作業環境

Ubuntu18.04.1 LTS を
Windows10の上に、VMwareによって構築した仮想環境で起動しています。
www.bioerrorlog.work


レジスタ操作でアクセス承認を引き出す

プログラムの実行 | 第1分岐 - ハズレルート

プログラムを実行させ、ステップごとの挙動を解析することで、より詳細な情報を得ることができます。

main関数にブレークポイント1を設置し、まずは引数を与えずにプログラムを実行してみます。

(gdb) break *main
Breakpoint 1 at 0x6da
(gdb) run
Starting program: /home/user/your_pass 

Breakpoint 1, 0x00005555555546da in main ()

main関数の開始点0x6daにブレークポイントが設置されたことによって、プログラムを実行runした際にmain関数で処理が一時停止している状態です。

ここでよくわからないのは、ブレークポイントを設置したときのアドレスは0x6da、同様にアセンブラコードで表示されるmain関数の開始点は0x00000000000006daなのに、runしたときのブレークポイントは0x00005555555546daを指していることです。 この555555554という数字は何を意味しているのでしょうか。 "gdb 555555554"などで検索すると、やはりgdbのブレークポイント関連でこの"555555554"というアドレスが登場しています。 とても気になるところですが、ひとまずこの数字は置いておいて、下三桁6daのみに着目して進めていきたいと思います。

それでは、niコマンド2を用いて、プログラムを一行ずつ実行していきます。

(gdb) ni
0x00005555555546db in main ()
(gdb) 
0x00005555555546de in main ()
(gdb) 
0x00005555555546e2 in main ()
(gdb) 
0x00005555555546e5 in main ()
(gdb) 
0x00005555555546e9 in main ()
(gdb) 
0x00005555555546ed in main ()

アドレス6edまで来ました3。 ここは、プログラムの流れ図でみると、最初の分岐点であることがわかります(Fig. 2, 赤矢頭)。

f:id:BioErrorLog:20190202175653j:plain
Fig. 2 第1分岐点
さて、どちらの分岐ルートに行くのでしょうか。 niコマンドで先へ進むと、

(gdb) ni
0x0000555555554748 in main ()

アドレス748、つまり左の分岐ルートに行ったことがわかります。 これは、アドレス6e9において、ある変数と0x2を比較cmpした結果が"not equal"だったため、アドレス748jne(jump not equal)した、ということを意味しています。

このままniコマンドで先へ行くと、

(gdb) ni
0x000055555555474f in main ()
(gdb) 
Access Denied.
0x0000555555554754 in main ()
(gdb) 
0x0000555555554759 in main ()
(gdb) 
0x000055555555475a in main ()

アドレス74f<puts>関数4によってAccess Denied.の文字列が表示された後、main関数の終了点75aに至りました。 つまり、このルートはアクセスが拒否されてしまうハズレルートであるということです。

ここまで、引数を何も与えずにプログラムを実行してきました。 次は、引数を与えて実行してみます。

プログラムの実行 | 第1分岐 - 当たりルート

それでは、引数wrong-passwordを与えて、同様の解析を行います。

(gdb) run wrong-password
Starting program: /home/user/your_pass wrong-password

Breakpoint 1, 0x00005555555546da in main ()
(gdb) ni
0x00005555555546db in main ()
(gdb) 
0x00005555555546de in main ()
(gdb) 
0x00005555555546e2 in main ()
(gdb) 
0x00005555555546e5 in main ()
(gdb) 
0x00005555555546e9 in main ()
(gdb) 
0x00005555555546ed in main ()

分岐点6edにやってきました。 niコマンドで先へ進むと、

(gdb) 
0x00005555555546ef in main ()

先程と違い、アドレス748へ飛ばず、6efへ行きました。 つまり今回は、流れ図での右側ルート、おそらく当たりルートに行けたということです。 お見事。

プログラムの実行 | 第2分岐 - ハズレルート

それでは引き続き、niコマンドで最後まで進んでみます。

~
(gdb) 
0x0000555555554709 in main ()
(gdb) 
Checking Your Pass: wrong-password
~
(gdb) 
0x000055555555472a in main ()
(gdb) 
0x000055555555473a in main ()
(gdb) 
0x0000555555554741 in main ()
(gdb) 
Access Denied.
~

709printf関数ではChecking Your Pass: wrong-passwordが表示され、その後の分岐点72aでは左側のルートに行き、741puts関数ではAccess Denied.が表示されました(Fig. 3)。 つまり、この左ルートはハズレです。

f:id:BioErrorLog:20190202182709j:plain
Fig. 3 第2分岐 左ルートはハズレ

プログラムの実行 | 第2分岐 - アクセス承認ルート

残るは、第2分岐の右ルートです。 おそらく、ここがアクセス承認のルートでしょう。
そこで、レジスタの値を操作することによって、このアクセス承認ルートへの突入を目指します。

分岐点0x72a jneは、直前の判定を受けてルートの分岐を決定しています。 改めてアセンブラコードからこの辺りを読むと、

~
   0x0000555555554723 <+73>: call   0x5555555545b0 <strcmp@plt>
   0x0000555555554728 <+78>: test   eax,eax
   0x000055555555472a <+80>: jne    0x55555555473a <main+96>
~

ここから読み取れる条件判定の流れは、次のようになります。

strcmpで入力パスワードと正規パスワードを比較し、eaxに結果を格納

testeaxの値をチェック

testの結果に応じてjne

下から順に詳細を考えていきます。
jneは、"zero flag" ZF==0のときにジャンプするコードです5。 そしてtestは、2つの変数のAND演算の結果を受けて、ZFを設定しています6。 今回の場合eaxeaxのAND演算を行っているので、eax==0のときのみ、ZFに1が格納されます。 つまり、jneによってジャンプせず、右の分岐ルートに行くには、eaxに0が格納されている必要があるわけです。

しかし、eax==0となるのは、strcmpが入力パスワードと正規パスワードを同一であるとみなした時だけです7。 正規パスワードがわからない以上、正面からのやり方では突破できません。

そこで、直接eaxの値を操作することによって、アクセス承認を目指します。 eaxは、レジスタraxの下位 32 ビットを指しています8。 そこで、testが行われるアドレス728で、raxレジスタを確認してみました。 ブレークポイントを0x0000555555554728に設定してcontinueコマンドを実行することで、一つずつniせずともアドレス728に行くことができます。 そこでレジスタを見ると、

Breakpoint 2, 0x0000555555554728 in main ()
(gdb) info registers
rax            0xfffffff0  4294967280
rbx            0x0 0
rcx            0x0 0
rdx            0x41    65
rsi            0x555555554800  93824992233472
rdi            0x7fffffffe30e  140737488347918
rbp            0x7fffffffde80  0x7fffffffde80
rsp            0x7fffffffde70  0x7fffffffde70
r8             0x0 0
r9             0x3 3
r10            0xfffffffd  4294967293
r11            0x246   582
r12            0x5555555545d0  93824992232912
r13            0x7fffffffdf60  140737488346976
r14            0x0 0
r15            0x0 0
rip            0x555555554728  0x555555554728 <main+78>
eflags         0x287   [ CF PF SF IF ]
cs             0x33    51
ss             0x2b    43
ds             0x0 0
es             0x0 0
fs             0x0 0
gs             0x0 0

raxには0xfffffff0が格納されていました。 それではここでeaxレジスタを操作して、0を格納します。 目論見が正しければ、それでアクセス承認が引き出せるはずです。

(gdb) set $eax=0

これでeaxに0を格納しました。 レジスタを確認すると、

(gdb) info registers
rax            0x0 0
~

確かにraxの値が0になっています。
それでは、このままniで先へ進むと、

(gdb) ni
0x000055555555472a in main ()
(gdb) 
0x000055555555472c in main ()
(gdb) 
0x0000555555554733 in main ()
(gdb) 
Hello, Master.
0x0000555555554738 in main ()

すばらしい。
見事、右の分岐ルートに入り、アクセス承認Hello, Master.を表示させることができました。


おわりに

今回は、gdbを用いてプログラムを実行させ、ルート分岐条件を解析することで、最終的にアクセス承認を引き出すことができました。

今回解析でわかったことを書き出すと、次のようになります。

f:id:BioErrorLog:20190202213942j:plain
Fig. 4 プログラムの解析結果

細かくプログラムを解析してきたので、だいぶプログラミングの仕組みといったものもわかってきました。 なかなか複雑で面白いものです。

ただし、アクセス承認を引き出す方法は、他にもたくさんあります。 というよりも、もっとずっと簡単な方法が何個もあります。 次回は、それをまとめたいと思います。

なお、今回もLiveOverflow氏の動画9を参考にしました。

[関連記事]
www.bioerrorlog.work

www.bioerrorlog.work


  1. ブレークポイントとは、その名の通り"一時停止"する場所です。runコマンドによってプログラムを実行した時、ブレークポイントを設置していればそこで立ち止まってくれます。逆に、ブレークポイントを設置せずに実行すると、最後まで一気に実行されてしまいます。

  2. niとよく似たコマンドに、siがあります。niは関数内部に入らずに実行し、siは関数内部に入り込んで実行します。今回はmain関数の流れのみに興味があるので、関数内部に入り込まないniコマンドを使っています。詳しくは別途記事にまとめる予定です。

  3. 同じコマンドを繰り返すときは、そのままEnterキーを押します。

  4. puts関数とは、マニュアルによるとputs - output of characters and strings、つまりprintf関数と同じようなものでしょう。

  5. http://dukedog.webcrow.jp/CheatEngineHelp/asm-basics-3.htm

  6. TEST (x86 instruction) - Wikipedia

  7. strcmpのマニュアルによると、It returns an integer less than, equal to, or greater than zero if s1 is found, respectively, to be less than, to match, or be greater than s2.つまりstrcmpは、比較する2つの変数が等しい時、0を返します。

  8. x64 アセンブリーの概要 | iSUS

  9. Reversing and Cracking first simple Program - bin 0x05 - YouTube

逆アセンブル解析 - gdb | リバースエンジニアリング入門#2

gdbを用いてバイナリコードを逆アセンブル (ディスアセンブル)し、Cで書かれたプログラムの全体像を解析します。


はじめに

おはよう。@bioerrorlogです。

パスワード認証プログラムをリバースエンジニアリングして、アクセス承認を引き出したいシリーズpart2です。

前回は、C言語で簡単なパスワード認証プログラムを作成しました。
www.bioerrorlog.work

今回はいよいよ、GNUデバッガgdbを用いて、パスワード認証プログラムを逆アセンブルしていきます。

wikipediaによると1、逆アセンブラとは次のようなものを指します。

実行ファイルないしオブジェクトファイルの機械語コード(とシンボルテーブルなどの付随情報)を基に、アセンブリ言語ソースコードを生成する、すなわちアセンブラの逆の作用をするものを特に指す。

Cコードでは、コンパイルによってバイナリコード(機械語コード)を生成しました。 逆アセンブラはそれとは逆方向に、バイナリコードからアセンブラコードを生成するわけです。
ただし、アセンブリ言語はC言語などよりも機械語よりの低水準言語ですので、入念な読み込みが必要です。

それでは、前回作成したソースコードについての記憶を一旦忘れ去り、バイナリコード"your_pass"のみを与えられたと想定して、逆アセンブル解析していきます。

なお、前回に引き続きLiveOverflow氏の動画2を参考にしています。


作業環境

Ubuntu18.04.1 LTS を
Windows10の上に、VMwareによって構築した仮想環境で起動しています。
www.bioerrorlog.work


逆アセンブル解析

gdbとは

gdbとは何たるかを知るため、まずはマニュアルを読んで概要を把握します。

$ man gdb
NAME
       gdb - The GNU Debugger
~
DESCRIPTION
       The purpose of a debugger such as GDB is to allow you to see what is going on "inside"
       another program while it executes -- or what another program was doing at the moment it
       crashed.

GNUデバッガgdbとは、実行中あるいはクラッシュしたプログラムの"中身"をみるためのもの、だそうです。

実際にgdbができることとは、

       ·   Start your program, specifying anything that might affect its behavior.

       ·   Make your program stop on specified conditions.

       ·   Examine what has happened, when your program has stopped.

       ·   Change things in your program, so you can experiment with correcting the effects of
           one bug and go on to learn about another.

意訳すると、
・プログラムを開始して、挙動に影響を与えるものを特定する。
・特定の条件で、プログラムを停止させる。
・プログラムが停止したとき、何が起こったのか確かめる。
・プログラムに変更を加えることで、バグを一つずつ検証できる。
といったことができるそうです。

なんとなく言わんとしてることはわかりますが、手を動かしてみないと正直イメージは湧いてきません。

アセンブラコードを表示する | (gdb) disassemble

それでは、gdbを使っていきます。
gdbにバイナリコード"your_pass"を渡し、解析を開始します。

$ gdb your_pass

これでgdbデバッガが開始されました。
さっそくmain関数を逆アセンブルします。

(gdb) disassemble main
Dump of assembler code for function main:
   0x00000000000006da <+0>:  push   %rbp
   0x00000000000006db <+1>:  mov    %rsp,%rbp
   0x00000000000006de <+4>:  sub    $0x10,%rsp
   0x00000000000006e2 <+8>:  mov    %edi,-0x4(%rbp)
   0x00000000000006e5 <+11>: mov    %rsi,-0x10(%rbp)
   0x00000000000006e9 <+15>: cmpl   $0x2,-0x4(%rbp)
   0x00000000000006ed <+19>: jne    0x748 <main+110>
   0x00000000000006ef <+21>: mov    -0x10(%rbp),%rax
   0x00000000000006f3 <+25>: add    $0x8,%rax
   0x00000000000006f7 <+29>: mov    (%rax),%rax
   0x00000000000006fa <+32>: mov    %rax,%rsi
   0x00000000000006fd <+35>: lea    0xe4(%rip),%rdi        # 0x7e8
   0x0000000000000704 <+42>: mov    $0x0,%eax
   0x0000000000000709 <+47>: callq  0x5a0 <printf@plt>
   0x000000000000070e <+52>: mov    -0x10(%rbp),%rax
   0x0000000000000712 <+56>: add    $0x8,%rax
   0x0000000000000716 <+60>: mov    (%rax),%rax
   0x0000000000000719 <+63>: lea    0xe0(%rip),%rsi        # 0x800
   0x0000000000000720 <+70>: mov    %rax,%rdi
   0x0000000000000723 <+73>: callq  0x5b0 <strcmp@plt>
   0x0000000000000728 <+78>: test   %eax,%eax
   0x000000000000072a <+80>: jne    0x73a <main+96>
   0x000000000000072c <+82>: lea    0x107(%rip),%rdi        # 0x83a
   0x0000000000000733 <+89>: callq  0x590 <puts@plt>
   0x0000000000000738 <+94>: jmp    0x754 <main+122>
   0x000000000000073a <+96>: lea    0x108(%rip),%rdi        # 0x849
   0x0000000000000741 <+103>:    callq  0x590 <puts@plt>
   0x0000000000000746 <+108>:    jmp    0x754 <main+122>
   0x0000000000000748 <+110>:    lea    0xfa(%rip),%rdi        # 0x849
   0x000000000000074f <+117>:    callq  0x590 <puts@plt>
   0x0000000000000754 <+122>:    mov    $0x0,%eax
   0x0000000000000759 <+127>:    leaveq 
   0x000000000000075a <+128>:    retq   
End of assembler dump.

こいつは面白そうな文字列が表示されました。
一行目には Dump of assembler code for function main:とあります。 つまり、main関数のアセンブラコードが表示されている3わけです。

ちなみに、アセンブリ言語の表示形式は、AT&Tとintelの2つの形式があります4。 gdbのデフォルトの表示方法はAT&Tであり、ご覧のようにすごく読みにくいものです。 これをintel方式にセットします。

(gdb) set disassembly-flavor intel

これで再び逆アセンブルすると、

Dump of assembler code for function main:
   0x00000000000006da <+0>:  push   rbp
   0x00000000000006db <+1>:  mov    rbp,rsp
   0x00000000000006de <+4>:  sub    rsp,0x10
   0x00000000000006e2 <+8>:  mov    DWORD PTR [rbp-0x4],edi
   0x00000000000006e5 <+11>: mov    QWORD PTR [rbp-0x10],rsi
   0x00000000000006e9 <+15>: cmp    DWORD PTR [rbp-0x4],0x2
   0x00000000000006ed <+19>: jne    0x748 <main+110>
   0x00000000000006ef <+21>: mov    rax,QWORD PTR [rbp-0x10]
   0x00000000000006f3 <+25>: add    rax,0x8
   0x00000000000006f7 <+29>: mov    rax,QWORD PTR [rax]
   0x00000000000006fa <+32>: mov    rsi,rax
   0x00000000000006fd <+35>: lea    rdi,[rip+0xe4]        # 0x7e8
   0x0000000000000704 <+42>: mov    eax,0x0
   0x0000000000000709 <+47>: call   0x5a0 <printf@plt>
   0x000000000000070e <+52>: mov    rax,QWORD PTR [rbp-0x10]
   0x0000000000000712 <+56>: add    rax,0x8
   0x0000000000000716 <+60>: mov    rax,QWORD PTR [rax]
   0x0000000000000719 <+63>: lea    rsi,[rip+0xe0]        # 0x800
   0x0000000000000720 <+70>: mov    rdi,rax
   0x0000000000000723 <+73>: call   0x5b0 <strcmp@plt>
   0x0000000000000728 <+78>: test   eax,eax
   0x000000000000072a <+80>: jne    0x73a <main+96>
   0x000000000000072c <+82>: lea    rdi,[rip+0x107]        # 0x83a
   0x0000000000000733 <+89>: call   0x590 <puts@plt>
   0x0000000000000738 <+94>: jmp    0x754 <main+122>
   0x000000000000073a <+96>: lea    rdi,[rip+0x108]        # 0x849
   0x0000000000000741 <+103>:    call   0x590 <puts@plt>
   0x0000000000000746 <+108>:    jmp    0x754 <main+122>
   0x0000000000000748 <+110>:    lea    rdi,[rip+0xfa]        # 0x849
   0x000000000000074f <+117>:    call   0x590 <puts@plt>
   0x0000000000000754 <+122>:    mov    eax,0x0
   0x0000000000000759 <+127>:    leave  
   0x000000000000075a <+128>:    ret    
End of assembler dump.

右の部分がだいぶスッキリしました。


[関連記事] radare2の使い方 | リバースエンジニアリング入門#5


アセンブラコードの流れを解析する

私のひとまずの目的は、上のアセンブラコードの全体的な流れを理解することです。 そのためには、ほとんどの部分は無視し、論理構造の上で重要な部分だけ読んでいきます。
その部分を抜き出すと、次のようになります。

~
   0x00000000000006e9 <+15>: cmp    DWORD PTR [rbp-0x4],0x2
   0x00000000000006ed <+19>: jne    0x748 <main+110>
~
   0x0000000000000709 <+47>: call   0x5a0 <printf@plt>
~
   0x0000000000000723 <+73>: call   0x5b0 <strcmp@plt>
   0x0000000000000728 <+78>: test   eax,eax
   0x000000000000072a <+80>: jne    0x73a <main+96>
~
   0x0000000000000733 <+89>: call   0x590 <puts@plt>
   0x0000000000000738 <+94>: jmp    0x754 <main+122>
~
   0x0000000000000741 <+103>:    call   0x590 <puts@plt>
   0x0000000000000746 <+108>:    jmp    0x754 <main+122>
~
   0x000000000000074f <+117>:    call   0x590 <puts@plt>
~

着目したのは、callと、jne(jmp)です。
callは、関数の呼び出しを行います5jneは”jump not equal”で、直前の判定(cmptest)にしたがった処理の分岐をしています。 普通のプログラム言語で言うところのif分岐のようなものでしょう。 jmpはそのまま"jump"で、条件による判定なしにjumpします。

さっそく、上から読み解いていきます。

~
   0x00000000000006e9 <+15>: cmp    DWORD PTR [rbp-0x4],0x2
   0x00000000000006ed <+19>: jne    0x748 <main+110>
~

最初のこの塊は、未知の文字列(DWORD PTR [rbp-0x4])を、2(0x2)6と比較(cmp)しています。 そしてその結果を受けた上で、アドレス0x748にジャンプ(jne)しています。 アドレス0x748の先を読んでみると、

   0x0000000000000748 <+110>:    lea    rdi,[rip+0xfa]        # 0x849
   0x000000000000074f <+117>:    call   0x590 <puts@plt>
   0x0000000000000754 <+122>:    mov    eax,0x0
   0x0000000000000759 <+127>:    leave  
   0x000000000000075a <+128>:    ret    

着目すべきはアドレス0x74fのみです。 ここでcall 0x590 <puts@plt>を実行した後、終了(ret)しています。 つまり、

   0x6e9:   cmp    ?,0x2
   0x6ed:   jne    0x748
            ↓
            ↓
   0x748:
   0x74f:   call   0x590 <puts@plt>
   おわり

これで一つの流れが分かりました。

こんな感じで、その他の分岐もすべて解析すると、次のようなプログラムの全体像が浮かび上がります(Fig. 1)。

f:id:BioErrorLog:20190202175344j:plain
Fig. 1 アセンブラコードから解析したプログラムの流れ


おわりに

今回は、gdbを用いてバイナリコードを逆アセンブルし、プログラムの流れを解析しました。 いよいよプログラムの裏の仕組みが見えてきたようで、面白くなってきました。

次回はもっと詳細の機能を解析し、パスワードが認証されるステップの特定を目指します。

[関連記事]

www.bioerrorlog.work

www.bioerrorlog.work


  1. 逆アセンブラ - Wikipedia

  2. Reversing and Cracking first simple Program - bin 0x05 - YouTube

  3. “Dump"とは、dump (program) - Wikipedia

  4. AT&Tとintelの違いはhttps://imada.sdu.dk/Employees/kslarsen-bak/Courses/dm18-2007-spring/Litteratur/IntelnATT.htmなどが詳しい。

  5. CPUがどのようにして関数を呼び出しているのか、あるいはアセンブラについての詳しい説明はHow a CPU works and Introduction to Assembler - bin 0x04 - YouTube

  6. “0x2"のように、頭に"0x"がつく数字は16進数を表します。

パスワード認証プログラムの作成 | リバースエンジニアリング入門#1

パスワード認証プログラムを作成し、それを自らリバースエンジニアリングしてアクセス承認を引き出したいシリーズのpart1です。

今回は下準備として、今後解析していくための簡単なパスワード認証プログラムを作成しました。


はじめに

おはよう。@bioerrorlogです。

プログラミングの勉強をしたい、という声をよく目にします。

もちろん、私もプログラミングを身につけたいと思っています。
しかし、よくある「プログラミング学習」類のものではあまり興奮が得られなかった1ので、気分転換を図ろうと思いました。

そこで、プログラミングの知識もろくにない私ですが、リバースエンジニアリングなるものに挑戦することにしました。
wikipediaによると、リバースエンジニアリングとは2

リバースエンジニアリング(Reverse engineeringから。直訳すれば逆行工学という意味)とは、機械を分解したり、製品の動作を観察したり、ソフトウェアの動作を解析するなどして、製品の構造を分析し、そこから製造方法や動作原理、設計図などの仕様やソースコードなどを調査することを指す。

今回の私の場合、ソフトウェアの動作を解析して、仕様を調査すること、ということになるでしょう。
こいつは面白そうです。

まずは、LiveOverflow氏の動画3を参考にしながら、自分で改変を加えつつ、流れを再現することを目指します。
今回は下準備として、これから使うパスワード認証プログラムを作成するところまで記しました。


作業環境

Ubuntu18.04.1 LTS を
Windows10の上に、VMwareによって構築した仮想環境で起動しています。
www.bioerrorlog.work


パスワード認証プログラムの作成

まずは、パスワード認証プログラムを作成しました。
後にバイナリコードを解析して、逆アセンブルするためのものです。
自分で作ったパスワード認証プログラムを自分で暴く、というのはなんとも滑稽なことですが、初心者の私にはもってこいの方法でしょう。

LiveOverflow氏のコード4を参考に、C言語で次のコード"your_pass.c"を書きました。

#include <string.h>
#include <stdio.h>

int main(int argc, char *argv[]) {
        if(argc==2) {
                printf("Checking Your Pass: %s\n", argv[1]);
                if(strcmp(argv[1], "Antoine-Marie-Jean-Baptiste-Roger_comte-de-Saint-Exupery")==0) {
                        printf("Hello, Master.\n");
                } else {
                        printf("Access Denied.\n");
                }

        } else {
                printf("Access Denied.\n");
        }
        return 0;
}

まずはコードを少し読み上げます。
"argc"と""argv"はコマンドライン引数と呼ばれ、、コード実行時の引数に関する情報を持っています。

例えばこのコード"your_pass.c"をコンパイルしてバイナリコード"your_pass"を作成し、次のように引数"mypass"を渡して実行してみます。

$ ./your_pass mypass

このときのコマンドライン引数は、

./your_pass mypass
argv[0] argv[1]

argc = 2 (引数の数)
となります。

つまり、コードの最初のif分岐 if(argc==2)は、実行時に引数が一つ渡されたかどうかを判定し、このif分岐がFALSEの場合は、 Access Denied. が表示されます。

一方、このif分岐がTRUEの場合、printf("Checking Your Pass: %s\n", argv[1]);を実行した後、渡された引数のチェックに移ります。

if(strcmp(argv[1], "Antoine-Marie-Jean-Baptiste-Roger_comte-de-Saint-Exupery")==0)

strcmp()は、2つの文字列が等しいときに0を返す関数です。
argv[1](実行時に渡した引数)が、正解のパスワード("Antoine-Marie-Jean-Baptiste-Roger_comte-de-Saint-Exupery")と等しいかどうか、を判定しています。

以上のことから、このコードの挙動は次のようになるはずです。

  • 正しいパスワード:Antoine-Marie-Jean-Baptiste-Roger_comte-de-Saint-Exupery
    を引数として渡したときのみ、"Hello, Master"が表示される。

  • それ以外では、"Access Denied."が表示される。

さっそくyour_pass.cをコンパイルして試してみます。

#コンパイル
$ gcc your_pass.c -o your_pass
#正解パスワードで実行
$ ./your_pass Antoine-Marie-Jean-Baptiste-Roger_comte-de-Saint-Exupery
Checking Your Pass: Antoine-Marie-Jean-Baptiste-Roger_comte-de-Saint-Exupery
Hello, Master.
#不正解パスワードで実行
$ ./your_pass wrong_pass
Checking Your Pass: wrong_pass
Access Denied.
#引数なしで実行
$ ./your_pass
Access Denied.

見事、予想通りの挙動をしてくれました。


おわりに

今回は、これから解析していくパスワード認証プログラムを下準備として作成しました。

それでは、一旦このソースコードについての記憶を消去します。

次回からの目的は、正解パスワードを渡さずしてアクセス承認("Hello, Master."の表示)を引き出すことです。
様々なやり方があるようですが、まずはバイナリコードを逆アセンブラ解析することによってプログラムの挙動を暴き、パスワード認証過程の迂回を目指します。

[関連記事]

www.bioerrorlog.work

www.bioerrorlog.work


  1. もちろん、うまくいかないまでも何かを作ろうと試行錯誤するのはとても楽しいです。しかし、いわゆる「プログラミング言語の勉強」なるものをやっていると、自分でも何がしたいのか分からなくなってきます。

  2. リバースエンジニアリング - Wikipedia

  3. Reversing and Cracking first simple Program - bin 0x05 - YouTube

  4. GitHub - LiveOverflow/liveoverflow_youtube: Material for the YouTube series