Infusion

Influence function-guided model poisoning via training document attacks.

Repository Layout

paper.tex                 # Main paper
common/                   # Shared code: G_delta computation, PGD projections, dataset wrappers
infusion/                 # Kronfluence monkey-patches to expose IHVP
kronfluence/              # Git submodule: EKFAC influence function library
cifar/                    # CIFAR-10 image classification experiments
caesar/                   # Caesar cipher experiments (alphabet size 26)
caesar_prime/             # Caesar cipher experiments (parameterised, alphabets 26 & 29)
gpt_neo/                  # GPT-Neo-8M language model experiments (TinyStories)
bash/                     # SLURM submission scripts
figures/                  # Generated paper figures

Experiments

CIFAR-10 (Section 5.1)

Train and attack: cifar/cifar_random_test_infusion.py Baselines: cifar/baselines/ Ablations: cifar/ablations/ Cross-architecture transfer: cifar/transfer/ Analysis notebooks: cifar/cifar_random_test_analysis.ipynb, cifar/cifar_paper_figures.ipynb

Caesar Ciphers (Section 5.2)

Training: caesar/train.py, caesar_prime/train_model.py Attack: caesar_prime/run_infusion_experiment.py Fourier / GCD analysis: caesar_prime/analyze_comparison.ipynb

GPT-Neo / TinyStories (Section 5.3)

Attack (animal word pairs): gpt_neo/run_animal_infusion.py Specificity analysis: gpt_neo/run_specificity_experiment.py Results: gpt_neo/analyze_animal_results.ipynb, gpt_neo/analyze_specificity_results.ipynb

Setup

conda env create -f pytorch_conda_env.yaml
# or
pip install -r requirements.txt

Kronfluence is included as a submodule:

git submodule update --init

Key Modules

common/G_delta.py -- computes the gradient direction for document perturbations
common/projections.py -- simplex and entropy projections for discrete-token PGD
infusion/kronfluence_patches.py -- patches kronfluence to store inverse-Hessian-vector products

Name		Name	Last commit message	Last commit date
Latest commit History 285 Commits
.gradio		.gradio
.vscode		.vscode
bash		bash
caesar		caesar
caesar_prime		caesar_prime
cifar		cifar
common		common
docs		docs
figures		figures
gpt_neo		gpt_neo
infusion		infusion
kronfluence @ 57fea7c		kronfluence @ 57fea7c
owl		owl
smolLM2		smolLM2
.gitignore		.gitignore
.gitmodules		.gitmodules
.python-version		.python-version
README.md		README.md
pyproject.toml		pyproject.toml
pytorch_conda_env.yaml		pytorch_conda_env.yaml
requirements.txt		requirements.txt
twitter-thread-infusion-announcement.txt		twitter-thread-infusion-announcement.txt
uv.lock		uv.lock

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Infusion

Repository Layout

Experiments

CIFAR-10 (Section 5.1)

Caesar Ciphers (Section 5.2)

GPT-Neo / TinyStories (Section 5.3)

Setup

Key Modules

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Infusion

Repository Layout

Experiments

CIFAR-10 (Section 5.1)

Caesar Ciphers (Section 5.2)

GPT-Neo / TinyStories (Section 5.3)

Setup

Key Modules

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages