Tong XIAO

I am building AI agents at Yutori. I had been working at Meta for 7.5 years, built multi-modality Llama models, face tracking in AR/VR, and the creation of stylized / photorealistic avatars.

I obtained my Ph.D. in Electronic Engineering at The Chinese University of Hong Kong, advised by Prof. Xiaogang Wang. I graduated from Tsinghua University with B. Eng. degree in Computer Science.

I am passionate about developing multi-modality foundation models and applying them to help extend human capabilities, build autonomous machines, and ultimately, engineer humanoids with general intelligence.

Curriculum Vitae Google Scholar

(2025/11) We introduced Yutori Navigator, a state-of-the-art AI web agent.
(2025/02) I joined Yutori to build AI agents for the web.

The Llama 3 Herd of Models

Llama team, core contributor

arXiv, 2024/07

PDF Homepage

Geometric Correspondence Fields: Learned Differentiable Rendering for 3D Pose Refinement in the Wild

Alexander Grabner, Yaming Wang, Peizhao Zhang, Peihong Guo, Tong Xiao, Peter Vajda, Peter M. Roth, Vincent Lepetit

European Conference on Computer Vision (ECCV), 2020

PDF

Order-Aware Generative Modeling Using the 3D-Craft Dataset

Zhuoyuan Chen*, Demi Guo*, Tong Xiao*, Saining Xie, Xinlei Chen, Haonan Yu, Jonathan Gray, Kavya Srinet, Haoqi Fan, Jerry Ma, Charles R. Qi, Shubham Tulsiani, Arthur Szlam, C. Lawrence Zitnick

IEEE International Conference on Computer Vision (ICCV), 2019

PDF Code

End-to-End Deep Kronecker-Product Matching for Person Re-Identification

Yantao Shen, Tong Xiao, Hongsheng Li, Shuai Yi, Xiaogang Wang

IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2018

PDF Code

Deep Group-Shuffling Random Walk for Person Re-Identification

Yantao Shen, Hongsheng Li, Tong Xiao, Shuai Yi, Dapeng Chen, Xiaogang Wang

IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2018

PDF Code

Video Person Re-Identification With Competitive Snippet-Similarity Aggregation and Co-Attentive Snippet Embedding

Dapeng Chen, Hongsheng Li, Tong Xiao, Shuai Yi, Xiaogang Wang

IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2018

PDF

Identity-Aware Textual-Visual Matching with Latent Co-attention

Shuang Li, Tong Xiao, Hongsheng Li, Wei Yang, Xiaogang Wang

IEEE International Conference on Computer Vision (ICCV), 2017

PDF

Learning Deep Neural Networks for Vehicle Re-ID with Visual-spatio-temporal Path Proposals

Yantao Shen, Tong Xiao, Hongsheng Li, Shuai Yi, Xiaogang Wang

IEEE International Conference on Computer Vision (ICCV), 2017

PDF

Joint Detection and Identification Feature Learning for Person Search

Tong Xiao*, Shuang Li*, Bochao Wang, Liang Lin, Xiaogang Wang

IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Spotlight, 2017

PDF Code

Person Search with Natural Language Description

Shuang Li, Tong Xiao, Hongsheng Li, Bolei Zhou, Dayu Yue, Xiaogang Wang

IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2017

PDF Dataset

Object Detection in Videos with Tubelet Proposal Networks

Kai Kang, Hongsheng Li, Tong Xiao, Wanli Ouyang, Junjie Yan, Xihui Liu, Xiaogang Wang

IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2017

PDF

Learning Deep Feature Representations with Domain Guided Dropout for Person Re-identification

Tong Xiao, Hongsheng Li, Wanli Ouyang, Xiaogang Wang

IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016

PDF Code

Learning from massive noisy labeled data for image classification

Tong Xiao, Tian Xia, Yi Yang, Chang Huang, Xiaogang Wang

IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2015

PDF Code Dataset

Crafting GBD-Net for Object Detection

X Zeng, W Ouyang, J Yan, H Li, T Xiao, K Wang, Y Liu, Y Zhou, B Yang, Z Wang, H Zhou, X Wang

arXiv preprint arXiv:1610.02579

PDF Code

T-CNN: Tubelets with Convolutional Neural Networks for Object Detection from Videos

K Kang, H Li, J Yan, X Zeng, B Yang, T Xiao, C Zhang, Z Wang, R Wang, X Wang, W Ouyang

arXiv preprint arXiv:1604.02532

PDF Code

Convolutional Neural Networks with Low-Rank Regularization

Cheng Tai, Tong Xiao, Yi Zhang, Xiaogang Wang, Weinan E

4th International Conference on Learning Representations (ICLR), 2016

PDF Code

DeepReid: Deep Filter Pairing Neural Network for Person Re-identification

Wei Li, Rui Zhao, Tong Xiao, Xiaogang Wang

IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2014

PDF Dataset

Member of Technical Staff at Yutori

tong.xiao.work[at]gmail.com

Short Bio

Recent News

Publications