すゞろなる記

すずろ【漫ろ】〈形動ナリ〉たいしたものではない。たわいもない。

非IT技術者向けのPython解説書を購入しました

衝動買いしてしまいました。

「仕事がはかどるPython自動処理全部入り。」です

f:id:Aru-Kaishain:20190821202531j:plain

Pythonを使うことを目的にしている人向けではなく、「最近よく耳にする、機械学習・AI(人工知能)の用途で用いられているPythonを使うと、実務的に例えばこのようなことができますよ」という本があればいいなあと漠然と思っていたところ、時間潰しに立ち寄った書店で目に飛び込んできました。

少し目次をご紹介しますが、例えば、文書ファイルから条件にあった文字列を抽出して転記するという作業は管理部門ではまだまだ、人手で行われていると思います。こういう現状に疑問を感じる人は、面白いのではないでしょうか。

 

f:id:Aru-Kaishain:20190821205503j:plain

冷静に考えると、このような自動化処理は必ずしもPythonに拘らなくても良いとは思いますが、「時流に乗ってPythonを学びたい/使うわけではないけれど齧ってみたい」という人には丁度良いと思います。

読み進めて更に気に入ったところが、IT技術者には当たり前の用語を、分かり易い言葉で解説しているところです。例えば、

・標準ライブラリ:プログラミングをする上で利用頻度の高い処理をまとめたツール

PowerShell(パワーシェル):Microsoft社が開発したコマンドラインインターフェースを提供するツール

といった具合に、平易な言葉で解説されています。PowerShellの箇所では勿論、コマンドプロンプトとの違いにも触れています。

 

この本を読んで、理解が進んだのが正規表現についてです。情報処理試験対策では学習したと思いますが、これが一体どのように役立つのかを考えることがありませんでした。自分なりに、正規表現とは「文字列をパターン化した表現」なのだと理解しました。例えばとある文書ファイルから郵便番号を抽出する処理を考えた場合、文字列の中から郵便番号を特定する必要があります。必ず郵便マーク(〒)が書かれている状況であれば別かもしれませんが、脈絡のない文字列の中から郵便番号を特定するには「郵便番号のパターン」を識別する必要があります。人間であれば、浅草郵便局の111-8799、大阪北郵便局の530-8799を拾うことはできますが、システム(プログラム)ではこの「数字3文字の後にハイフンが来て、その後に数字4文字が来る」パターンを\d{3}-\d{4}という表現で特定します。

Pythonには関係ありませんが予期せず、正規表現の理解が進み、自動処理を実行させるトリガー(契機)にも考えを巡らせる機会になりました。この本の狙い通り、「非IT技術者」にお勧めです。