pandasの条件に応じた置換や代入をmaskとリスト内包表記で実装する

それぞれの方法で処理時間も計測

リスト内包表記による方法が柔軟でコードも読みやすいけれども処理時間を考慮するとmaskで対応したほうが良い

🕒 Last mod: 2021-08-13


Pandas to_csvで標準出力にcsvファイルを出力する

シンプルにsys.stdoutを指定することで実現可能

pandasのバージョンによってはエラーが発生したこともあったようだけど比較的新しいバージョンなら問題なさそう

🕒 Last mod: 2021-08-05


最初の行から自分自身の行までの要素のユニークカウント

簡単そうだけれども地味に実装方法で悩んだexpanding nunique

expanding nuniqueの実装例と処理時間を考慮した実装方法のご紹介

🕒 Last mod: 2021-07-17


pandas.core.groupby.GroupBy.aggのNamed Aggregation

使い勝手が良いNamed Aggregationを使いこなす

便利だけど情報が少ないNamed Aggregationについて調べたことを整理します

🕒 Last mod: 2021-06-17


pandas.qcutでデシル分析

簡単で使い勝手の良いビニング(離散化)

簡単なので便利なデシル分析をqcutで実装します

🕒 Last mod: 2021-05-30


SQLの分析関数:Window Function RankをPandasで実現する

transform関数

自作問題を作成してSQLとPandasで回答します

🕒 Last mod: 2021-02-16


sqlのWindowFunction:分析関数をPandas.expandingで実装

WindowFunctionの機能が強力なのでPandasでの実装方法も試しておきたい

データサイエンス100本ノックにもそれらしき問題がないので問題を自作します

🕒 Last mod: 2021-02-13


pandas.DataFrame.transformを使いこなしたい

groupby.aggの結果をDataFrameに追加する

🕒 Last mod: 2021-01-06


pandas.DataFrame.pipeを使用してメソッドチェーン内で自分自身を参照する

メソッドチェーンで自分自身を参照したいことがある

🕒 Last mod: 2021-01-03


Pandasのメソッドチェーンで列名を変更する.set_axis

メソッドチェーンで列名を変更する方法がすぐにわからずに調べたので共有します

🕒 Last mod: 2020-12-24