Fuwen Tan

I work on making image/video generation models and large language models faster, with recent work on distillation, quantization, and efficient inference. I am a main developer of MAI-Image-2.5-Flash, an efficiency-optimized variant of MAI-Image-2.5, and received a Best Paper Finalist at CVPR 2019.

Resume Email GitHub

Research

ICLR 2025LLM inference

Progressive Mixed-Precision Decoding for Efficient LLM Inference

Hao Mark Chen, Fuwen Tan, Alexandros Kouris, Royson Lee, Hongxiang Fan, Stylianos I. Venieris

Paper Code BibTeX

EMNLP Findings 2024On-device LLMs

MobileQuant: Mobile-friendly Quantization for On-device Language Models

Fuwen Tan, Royson Lee, Lukasz Dudziak, Shell Xu Hu, Sourav Bhattacharya, Timothy Hospedales, Georgios Tzimiropoulos, Brais Martinez

Paper Code BibTeX

ICLR 2023Self-supervised learning

Effective Self-supervised Pre-training on Low-compute Networks without Distillation

Fuwen Tan, Fatemeh Saleh, Brais Martinez

Paper Code Poster Slides BibTeX

2022Video representation learning

iBoot: Image-bootstrapped Self-Supervised Video Representation Learning

Fatemeh Saleh, Fuwen Tan, Adrian Bulat, Georgios Tzimiropoulos, Brais Martinez

Paper BibTeX

ECCV 2022Efficient vision models

EdgeViTs: Competing Light-weight CNNs on Mobile Devices with Vision Transformers

Junting Pan, Adrian Bulat, Fuwen Tan, Xiatian Zhu, Lukasz Dudziak, Hongsheng Li, Georgios Tzimiropoulos, Brais Martinez

Paper Code BibTeX

ICCV 2021Image retrieval

Instance-level Image Retrieval using Reranking Transformers

Fuwen Tan, Jiangbo Yuan, Vicente Ordonez

Paper Code BibTeX

AAAI 2021Semi-supervised learning

Curriculum Labeling: Self-paced Pseudo-Labeling for Semi-Supervised Learning

Paola Cascante-Bonilla, Fuwen Tan, Yanjun Qi, Vicente Ordonez

Paper Code BibTeX

NeurIPS 2019Vision and language

Drill-down: Interactive Retrieval of Complex Scenes using Natural Language Queries

Fuwen Tan, Paola Cascante-Bonilla, Xiaoxiao Guo, Hui Wu, Song Feng, Vicente Ordonez

Paper Code Poster BibTeX

CVPR 2019 OralVision and language

Text2Scene: Generating Compositional Scenes from Textual Descriptions

Fuwen Tan, Song Feng, Vicente Ordonez

Best Paper Finalist

Paper Code Poster Slides BibTeX

WACV 2018Image composition

Where and Who? Automatic Semantic-Aware Person Composition

Fuwen Tan, Crispin Bernier, Benjamin Cohen, Vicente Ordonez, Connelly Barnes

Paper Supplement Code Video BibTeX

ACM MM 20173D telepresence

FaceCollage: A Rapidly Deployable System for Real-time Head Reconstruction for On-The-Go 3D Telepresence

Fuwen Tan, Chi-Wing Fu, Teng Deng, Jianfei Cai, Tat Jen Cham

Paper Video Poster BibTeX

ICME 2013Depth filtering

High-Quality Kinect Depth Filtering For Real-time 3D Telepresence

Mengyao Zhao, Fuwen Tan, Chi-Wing Fu, Chi-Keung Tang, Jianfei Cai, Tat Jen Cham

IEEE Xplore BibTeX

SIGGRAPH Asia 2012Shape composition

Field-guided Registration for Feature-conforming Shape Composition

Hui Huang, Minglun Gong, Daniel Cohen-Or, Yaobin Ouyang, Fuwen Tan, Hao Zhang

Project Paper BibTeX

Thesis

Learning Local Representations of Images and Text

Images and text exhibit hierarchical structures: scenes are built from objects, sentences from words. This thesis develops techniques for learning local representations of images and text, with applications in visual recognition, retrieval, and synthesis.

Thesis Slides