{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "# Simple example\n", "\n", "## Import the BipartitePandas package\n", "\n", "Make sure to install it using `pip install bipartitepandas`." ] }, { "cell_type": "code", "execution_count": 1, "metadata": {}, "outputs": [], "source": [ "import bipartitepandas as bpd" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Get your data ready\n", "\n", "For this notebook, we simulate data (we set parameters to make data cleaning interesting)." ] }, { "cell_type": "code", "execution_count": 2, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
| \n", " | i | \n", "j | \n", "y | \n", "t | \n", "l | \n", "k | \n", "alpha | \n", "psi | \n", "
|---|---|---|---|---|---|---|---|---|
| 0 | \n", "0 | \n", "416 | \n", "-0.935824 | \n", "0 | \n", "2 | \n", "4 | \n", "0.000000 | \n", "-0.114185 | \n", "
| 1 | \n", "0 | \n", "416 | \n", "0.903535 | \n", "1 | \n", "2 | \n", "4 | \n", "0.000000 | \n", "-0.114185 | \n", "
| 2 | \n", "0 | \n", "416 | \n", "-0.466674 | \n", "2 | \n", "2 | \n", "4 | \n", "0.000000 | \n", "-0.114185 | \n", "
| 3 | \n", "0 | \n", "416 | \n", "0.163563 | \n", "3 | \n", "2 | \n", "4 | \n", "0.000000 | \n", "-0.114185 | \n", "
| 4 | \n", "0 | \n", "416 | \n", "0.602699 | \n", "4 | \n", "2 | \n", "4 | \n", "0.000000 | \n", "-0.114185 | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 49995 | \n", "9999 | \n", "344 | \n", "-0.781453 | \n", "0 | \n", "1 | \n", "3 | \n", "-0.430727 | \n", "-0.348756 | \n", "
| 49996 | \n", "9999 | \n", "344 | \n", "0.008461 | \n", "1 | \n", "1 | \n", "3 | \n", "-0.430727 | \n", "-0.348756 | \n", "
| 49997 | \n", "9999 | \n", "344 | \n", "-0.959677 | \n", "2 | \n", "1 | \n", "3 | \n", "-0.430727 | \n", "-0.348756 | \n", "
| 49998 | \n", "9999 | \n", "344 | \n", "0.068173 | \n", "3 | \n", "1 | \n", "3 | \n", "-0.430727 | \n", "-0.348756 | \n", "
| 49999 | \n", "9999 | \n", "344 | \n", "-0.733225 | \n", "4 | \n", "1 | \n", "3 | \n", "-0.430727 | \n", "-0.348756 | \n", "
50000 rows × 8 columns
\n", "| \n", " | i | \n", "j | \n", "y | \n", "t | \n", "
|---|---|---|---|---|
| 0 | \n", "0 | \n", "416 | \n", "-0.935824 | \n", "0 | \n", "
| 1 | \n", "0 | \n", "416 | \n", "0.903535 | \n", "1 | \n", "
| 2 | \n", "0 | \n", "416 | \n", "-0.466674 | \n", "2 | \n", "
| 3 | \n", "0 | \n", "416 | \n", "0.163563 | \n", "3 | \n", "
| 4 | \n", "0 | \n", "416 | \n", "0.602699 | \n", "4 | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 49995 | \n", "9999 | \n", "344 | \n", "-0.781453 | \n", "0 | \n", "
| 49996 | \n", "9999 | \n", "344 | \n", "0.008461 | \n", "1 | \n", "
| 49997 | \n", "9999 | \n", "344 | \n", "-0.959677 | \n", "2 | \n", "
| 49998 | \n", "9999 | \n", "344 | \n", "0.068173 | \n", "3 | \n", "
| 49999 | \n", "9999 | \n", "344 | \n", "-0.733225 | \n", "4 | \n", "
50000 rows × 4 columns
\n", "| \n", " | i | \n", "j | \n", "y | \n", "t | \n", "m | \n", "
|---|---|---|---|---|---|
| 0 | \n", "0 | \n", "0 | \n", "1.306939 | \n", "0 | \n", "0 | \n", "
| 1 | \n", "0 | \n", "0 | \n", "-0.005591 | \n", "1 | \n", "0 | \n", "
| 2 | \n", "0 | \n", "0 | \n", "-0.192813 | \n", "2 | \n", "0 | \n", "
| 3 | \n", "0 | \n", "0 | \n", "2.537212 | \n", "3 | \n", "0 | \n", "
| 4 | \n", "0 | \n", "0 | \n", "1.756664 | \n", "4 | \n", "0 | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 44576 | \n", "8962 | \n", "797 | \n", "-0.781453 | \n", "0 | \n", "0 | \n", "
| 44577 | \n", "8962 | \n", "797 | \n", "0.008461 | \n", "1 | \n", "0 | \n", "
| 44578 | \n", "8962 | \n", "797 | \n", "-0.959677 | \n", "2 | \n", "0 | \n", "
| 44579 | \n", "8962 | \n", "797 | \n", "0.068173 | \n", "3 | \n", "0 | \n", "
| 44580 | \n", "8962 | \n", "797 | \n", "-0.733225 | \n", "4 | \n", "0 | \n", "
44581 rows × 5 columns
\n", "