pandas.DataFrame.isinの辞書型指定による条件抽出が便利

pandas.Series.isinではなくDataFrame.isinなら辞書型による条件指定が可能

データフレームの抽出条件を辞書型パラメータで指定するときに便利なので実装例を紹介します

🕒 Last mod: 2021-12-16


最低限の設定でpythonの自作パッケージを配布する

個人的なツールや限定的なチーム内で簡略的にパッケージを配布する方法を模索する

setuptoolsはこだわりすぎると面倒なのでできるだけ楽な形を身につける

🕒 Last mod: 2021-12-10


seabornのFacetgridの軸ラベルを自由自在に扱いたい

figureレベルのFacetgridから軸ラベルを取得し加工して軸ラベルに設定する

plotは設定項目が多く構成が複雑で自由自在に扱うのが難しいのでせめて軸ラベルだけでも自在に扱いたい

🕒 Last mod: 2021-12-03


seaborn.displotでヒストグラムを作成する

seabornでのヒストグラム作成はdisplotが良さそう

seabornでヒストグラムを作成する関数が3種類存在していてどれを使えば良いか迷うけどdisplotが良さそう

🕒 Last mod: 2021-10-01


「岩波データサイエンス Vol.3」で使用している公開データセットを確認

使い勝手の良さそうなデータセットがcsvで公開されているので内容を確認する

データ件数が多く変数の種類も豊富でマーケティング分析のサンプルデータとして魅力的なデータセット

🕒 Last mod: 2021-09-30


make_classificationで分類データを作成してみる

引数に関係性があるので設定値によってはエラーが発生する

分類データを作成できるのは便利だけど使いこなすのが案外難しいのでいくつか試してみた

🕒 Last mod: 2021-08-27


pythonでシグモイド関数を実装する

定義にしたがって独自関数sigmoidを実装してみる

結論としてscipy.special.expitを使用するのが良さそう

🕒 Last mod: 2021-07-30


目的変数の対数変換を効率化するsklearn.compose.TransformedTargetRegressor

地味に面倒な目的変数の対数変換がTransformedTargetRegressorで楽になります

目的変数を変換して、予測値を逆変換して、のような面倒な処理を効率化する方法を実際に試して紹介します

🕒 Last mod: 2021-07-04


2つのpandas.DataFrameを比較する

equalsとcompareを使いこなす

利用局面が多いが使いたいときに少し迷うDataFrameの比較方法

🕒 Last mod: 2021-04-27


pandas.DataFrame.transformを使いこなしたい

groupby.aggの結果をDataFrameに追加する

🕒 Last mod: 2021-01-06