ORYX

A Library for Large Vision-Language Models

Plugins

Installs

Most Used Tags

multimodal(1)visual-grounding(1)conversation-generation(1)image-captioning(1)dataset(1)

Published Resources

GLaMM is a cutting-edge multimodal model for visual grounding and grounded conversation generation.