Jackson Kek's blog

10 Mar, 2025 Can an LLM Learn to See? Fine-Tuning Qwen 0.5B for Vision Tasks with SFT + GRPO
20 Jan, 2024 Self-Rewarding Language Model
16 Oct, 2023 QLoRA: Efficient Finetuning of Quantized LLMs
04 Oct, 2023 LongLoRA: Efficient Fine tuning of Long Context Large Language Models
30 Sep, 2023 LoRA: Low-Rank Adaptation of Large Language Models
19 Aug, 2023 Getting Started with Distributed Data Parallel in PyTorch: A Beginner's Guide
28 Jun, 2023 FlashAttention: Fast and Memory Efficient Exact Attention
16 Jun, 2023 I-JEPA: Self-Supervised Learning from Images with a Joint-Embedding Predictive Architecture
28 May, 2023 Break-A-Scene: Extracting Multiple Concepts from a Single Image