Add CLIPSeg #20066

NielsRogge · 2022-11-04T14:09:32Z

What does this PR do?

This PR adds CLIPSeg, a nice extension of CLIP for zero-shot and one-shot (image-guided) image segmentation.

To do:

transfer checkpoints and update code
update base_model_prefix

src/transformers/models/clipseg/test.py

HuggingFaceDocBuilderDev · 2022-11-04T15:06:21Z

The documentation is not available anymore as the PR was closed or merged.

sgugger

Looking good, thanks for adding this model! Make sure you update the paper link in the doc file, and the config should take into account the latest modifications done on the CLIP config.

docs/source/en/model_doc/clipseg.mdx

src/transformers/models/clipseg/configuration_clipseg.py

src/transformers/models/clipseg/modeling_clipseg.py

src/transformers/models/clipseg/test.py

tests/models/clipseg/test_modeling_clipseg.py

alaradirik · 2022-11-07T08:58:59Z

tests/models/clipseg/test_processor_clipseg.py

+        """This function prepares a list of PIL images, or a list of numpy arrays if one specifies numpify=True,
+        or a list of PyTorch tensors if one specifies torchify=True.
+        """
+
+        image_inputs = [np.random.randint(255, size=(3, 30, 400), dtype=np.uint8)]
+
+        image_inputs = [Image.fromarray(np.moveaxis(x, 0, -1)) for x in image_inputs]
+


Suggested change

"""This function prepares a list of PIL images, or a list of numpy arrays if one specifies numpify=True,

or a list of PyTorch tensors if one specifies torchify=True.

"""

image_inputs = [np.random.randint(255, size=(3, 30, 400), dtype=np.uint8)]

image_inputs = [Image.fromarray(np.moveaxis(x, 0, -1)) for x in image_inputs]

"""

This function prepares a list of PIL images, or a list of numpy arrays if one specifies numpify=True,

or a list of PyTorch tensors if one specifies torchify=True.

"""

image_inputs = [np.random.randint(255, size=(3, 30, 400), dtype=np.uint8)]

image_inputs = [Image.fromarray(np.moveaxis(x, 0, -1)) for x in image_inputs]

src/transformers/models/clipseg/configuration_clipseg.py

src/transformers/models/clipseg/modeling_clipseg.py

alaradirik

Thanks for the addition! Looks ready to merge once the docstrings are complete and all tests are passing.

polavishnu4444 · 2022-11-26T05:15:44Z

Is the CLIPSeg yet to be released in the latest version?

* Add first draft * Update conversion script * Improve conversion script * Improve conversion script some more * Add conditional embeddings * Add initial decoder * Fix activation function of decoder * Make decoder outputs match original implementation * Make decoder outputs match original implementation * Add more copied from statements * Improve model outputs * Fix auto tokenizer file * Fix more tests * Add test * Improve README and docs, improve conditional embeddings * Fix more tests * Remove print statements * Remove initial embeddings * Improve conversion script * Add interpolation of position embeddings * Finish addition of interpolation of position embeddings * Add support for refined checkpoint * Fix refined checkpoint * Remove unused parameter * Improve conversion script * Add support for training * Fix conversion script * Add CLIPSegFeatureExtractor * Fix processor * Fix CLIPSegProcessor * Fix conversion script * Fix most tests * Fix equivalence test * Fix README * Add model to doc tests * Use better variable name * Convert other checkpoint as well * Update config, add link to paper * Add docs * Update organization * Replace base_model_prefix with clip * Fix base_model_prefix * Fix checkpoint of config * Fix config checkpoint * Remove file * Use logits for output * Fix tests Co-authored-by: Niels Rogge <nielsrogge@Nielss-MacBook-Pro.local>

NielsRogge requested review from sgugger and alaradirik November 4, 2022 14:16

NielsRogge commented Nov 4, 2022

View reviewed changes

src/transformers/models/clipseg/test.py Outdated Show resolved Hide resolved

NielsRogge mentioned this pull request Nov 4, 2022

Adding CLIPSeg to HuggingFace Transformers 🤗 timojl/clipseg#18

Closed

sgugger reviewed Nov 4, 2022

View reviewed changes

alaradirik reviewed Nov 7, 2022

View reviewed changes

src/transformers/models/clipseg/configuration_clipseg.py Outdated Show resolved Hide resolved

alaradirik reviewed Nov 7, 2022

View reviewed changes

src/transformers/models/clipseg/configuration_clipseg.py Outdated Show resolved Hide resolved

alaradirik reviewed Nov 7, 2022

View reviewed changes

src/transformers/models/clipseg/modeling_clipseg.py Outdated Show resolved Hide resolved

alaradirik approved these changes Nov 7, 2022

View reviewed changes

Niels Rogge added 19 commits November 7, 2022 15:17

Add first draft

a74eed8

Update conversion script

b7dd5ad

Improve conversion script

8d03901

Improve conversion script some more

1053fae

Add conditional embeddings

801be5f

Add initial decoder

e0007f2

Fix activation function of decoder

ca7f092

Make decoder outputs match original implementation

346246e

Make decoder outputs match original implementation

8eac500

Add more copied from statements

7244954

Improve model outputs

38239ec

Fix auto tokenizer file

0d94e8f

Fix more tests

bdf01aa

Add test

cbe5742

Improve README and docs, improve conditional embeddings

788e8ea

Fix more tests

61fab4b

Remove print statements

cdbc867

Remove initial embeddings

aea0d3b

Improve conversion script

d041b96

Niels Rogge added 19 commits November 7, 2022 15:17

Fix refined checkpoint

9ebe436

Remove unused parameter

b689555

Improve conversion script

fae27ad

Add support for training

174d631

Fix conversion script

23d78a7

Add CLIPSegFeatureExtractor

207ab72

Fix processor

09b7e03

Fix CLIPSegProcessor

751f6e4

Fix conversion script

061ce9f

Fix most tests

f234652

Fix equivalence test

a2a5213

Fix README

dca1473

Add model to doc tests

cbd26c4

Use better variable name

2d4c095

Convert other checkpoint as well

174a8f9

Update config, add link to paper

a8eb2de

Add docs

96409fa

Update organization

fd7a2a6

Replace base_model_prefix with clip

cb0ff6d

NielsRogge force-pushed the add_clip branch from 5411c16 to cb0ff6d Compare November 7, 2022 14:22

Niels Rogge added 6 commits November 7, 2022 16:00

Fix base_model_prefix

8c26ccb

Fix checkpoint of config

d79913b

Fix config checkpoint

2a643a0

Remove file

56ee683

Use logits for output

3af9925

Fix tests

6e017b5

NielsRogge merged commit 2589630 into huggingface:main Nov 8, 2022

idilsulo mentioned this pull request Dec 18, 2022

Add visual prompt to processor of CLIPSeg model #20816

Merged

5 tasks

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Add CLIPSeg #20066

Add CLIPSeg #20066

NielsRogge commented Nov 4, 2022 •

edited

HuggingFaceDocBuilderDev commented Nov 4, 2022 •

edited

sgugger left a comment

alaradirik Nov 7, 2022

alaradirik left a comment

polavishnu4444 commented Nov 26, 2022

Add CLIPSeg #20066

Add CLIPSeg #20066

Conversation

NielsRogge commented Nov 4, 2022 • edited

What does this PR do?

HuggingFaceDocBuilderDev commented Nov 4, 2022 • edited

sgugger left a comment

Choose a reason for hiding this comment

alaradirik Nov 7, 2022

Choose a reason for hiding this comment

alaradirik left a comment

Choose a reason for hiding this comment

polavishnu4444 commented Nov 26, 2022

NielsRogge commented Nov 4, 2022 •

edited

HuggingFaceDocBuilderDev commented Nov 4, 2022 •

edited