npm - @huggingface/tasks - Versions diffs - 0.8.0 → 0.9.0 - Mend

@huggingface/tasks 0.8.0 → 0.9.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (11) hide show

package/dist/index.cjs +160 -85
package/dist/index.d.ts +16 -2
package/dist/index.js +160 -85
package/package.json +1 -1
package/src/model-libraries-snippets.ts +14 -0
package/src/model-libraries.ts +14 -0
package/src/tasks/feature-extraction/about.md +2 -9
package/src/tasks/feature-extraction/data.ts +1 -2
package/src/tasks/image-feature-extraction/about.md +23 -0
package/src/tasks/image-feature-extraction/data.ts +51 -0
package/src/tasks/index.ts +2 -1

package/dist/index.js CHANGED Viewed

@@ -1689,7 +1689,7 @@ var taskData5 = {
     }
   ],
   spaces: [],
-  summary: "Feature extraction refers to the process of transforming raw data into numerical features that can be processed while preserving the information in the original dataset.",
+  summary: "Feature extraction is the task of extracting features learnt in a model.",
   widgetModels: ["facebook/bart-base"]
 };
 var data_default5 = taskData5;
@@ -1855,8 +1855,57 @@ var taskData7 = {
 };
 var data_default7 = taskData7;
-// src/tasks/image-to-image/data.ts
+// src/tasks/image-feature-extraction/data.ts
 var taskData8 = {
+  datasets: [
+    {
+      description: "ImageNet-1K is a image classification dataset in which images are used to train image-feature-extraction models.",
+      id: "imagenet-1k"
+    }
+  ],
+  demo: {
+    inputs: [
+      {
+        filename: "mask-generation-input.png",
+        type: "img"
+      }
+    ],
+    outputs: [
+      {
+        table: [
+          ["Dimension 1", "Dimension 2", "Dimension 3"],
+          ["0.21236686408519745", "1.0919708013534546", "0.8512550592422485"],
+          ["0.809657871723175", "-0.18544459342956543", "-0.7851548194885254"],
+          ["1.3103108406066895", "-0.2479034662246704", "-0.9107287526130676"],
+          ["1.8536205291748047", "-0.36419737339019775", "0.09717650711536407"]
+        ],
+        type: "tabular"
+      }
+    ]
+  },
+  metrics: [],
+  models: [
+    {
+      description: "A powerful image feature extraction model.",
+      id: "timm/vit_large_patch14_dinov2.lvd142m"
+    },
+    {
+      description: "A strong image feature extraction model.",
+      id: "google/vit-base-patch16-224-in21k"
+    },
+    {
+      description: "A robust image feature extraction models.",
+      id: "facebook/dino-vitb16"
+    }
+  ],
+  spaces: [],
+  summary: "Image feature extraction is the task of extracting features learnt in a computer vision model.",
+  widgetModels: []
+};
+var data_default8 = taskData8;
+// src/tasks/image-to-image/data.ts
+var taskData9 = {
   datasets: [
     {
       description: "Synthetic dataset, for image relighting",
@@ -1948,10 +1997,10 @@ var taskData8 = {
   widgetModels: ["lllyasviel/sd-controlnet-canny"],
   youtubeId: ""
 };
-var data_default8 = taskData8;
+var data_default9 = taskData9;
 // src/tasks/image-to-text/data.ts
-var taskData9 = {
+var taskData10 = {
   datasets: [
     {
       // TODO write proper description
@@ -2028,10 +2077,10 @@ var taskData9 = {
   widgetModels: ["Salesforce/blip-image-captioning-base"],
   youtubeId: ""
 };
-var data_default9 = taskData9;
+var data_default10 = taskData10;
 // src/tasks/image-segmentation/data.ts
-var taskData10 = {
+var taskData11 = {
   datasets: [
     {
       description: "Scene segmentation dataset.",
@@ -2123,10 +2172,10 @@ var taskData10 = {
   widgetModels: ["facebook/detr-resnet-50-panoptic"],
   youtubeId: "dKE8SIt9C-w"
 };
-var data_default10 = taskData10;
+var data_default11 = taskData11;
 // src/tasks/mask-generation/data.ts
-var taskData11 = {
+var taskData12 = {
   datasets: [],
   demo: {
     inputs: [
@@ -2175,10 +2224,10 @@ var taskData11 = {
   widgetModels: [],
   youtubeId: ""
 };
-var data_default11 = taskData11;
+var data_default12 = taskData12;
 // src/tasks/object-detection/data.ts
-var taskData12 = {
+var taskData13 = {
   datasets: [
     {
       // TODO write proper description
@@ -2250,10 +2299,10 @@ var taskData12 = {
   widgetModels: ["facebook/detr-resnet-50"],
   youtubeId: "WdAeKSOpxhw"
 };
-var data_default12 = taskData12;
+var data_default13 = taskData13;
 // src/tasks/depth-estimation/data.ts
-var taskData13 = {
+var taskData14 = {
   datasets: [
     {
       description: "NYU Depth V2 Dataset: Video dataset containing both RGB and depth sensor data",
@@ -2307,10 +2356,10 @@ var taskData13 = {
   widgetModels: [""],
   youtubeId: ""
 };
-var data_default13 = taskData13;
+var data_default14 = taskData14;
 // src/tasks/placeholder/data.ts
-var taskData14 = {
+var taskData15 = {
   datasets: [],
   demo: {
     inputs: [],
@@ -2327,10 +2376,10 @@ var taskData14 = {
   /// (eg, text2text-generation is the canonical ID of translation)
   canonicalId: void 0
 };
-var data_default14 = taskData14;
+var data_default15 = taskData15;
 // src/tasks/reinforcement-learning/data.ts
-var taskData15 = {
+var taskData16 = {
   datasets: [
     {
       description: "A curation of widely used datasets for Data Driven Deep Reinforcement Learning (D4RL)",
@@ -2396,10 +2445,10 @@ var taskData15 = {
   widgetModels: [],
   youtubeId: "q0BiUn5LiBc"
 };
-var data_default15 = taskData15;
+var data_default16 = taskData16;
 // src/tasks/question-answering/data.ts
-var taskData16 = {
+var taskData17 = {
   datasets: [
     {
       // TODO write proper description
@@ -2463,10 +2512,10 @@ var taskData16 = {
   widgetModels: ["deepset/roberta-base-squad2"],
   youtubeId: "ajPx5LwJD-I"
 };
-var data_default16 = taskData16;
+var data_default17 = taskData17;
 // src/tasks/sentence-similarity/data.ts
-var taskData17 = {
+var taskData18 = {
   datasets: [
     {
       description: "Bing queries with relevant passages from various web sources.",
@@ -2558,10 +2607,10 @@ var taskData17 = {
   widgetModels: ["sentence-transformers/all-MiniLM-L6-v2"],
   youtubeId: "VCZq5AkbNEU"
 };
-var data_default17 = taskData17;
+var data_default18 = taskData18;
 // src/tasks/summarization/data.ts
-var taskData18 = {
+var taskData19 = {
   canonicalId: "text2text-generation",
   datasets: [
     {
@@ -2627,10 +2676,10 @@ var taskData18 = {
   widgetModels: ["sshleifer/distilbart-cnn-12-6"],
   youtubeId: "yHnr5Dk2zCI"
 };
-var data_default18 = taskData18;
+var data_default19 = taskData19;
 // src/tasks/table-question-answering/data.ts
-var taskData19 = {
+var taskData20 = {
   datasets: [
     {
       description: "The WikiTableQuestions dataset is a large-scale dataset for the task of question answering on semi-structured tables.",
@@ -2681,10 +2730,10 @@ var taskData19 = {
   summary: "Table Question Answering (Table QA) is the answering a question about an information on a given table.",
   widgetModels: ["google/tapas-base-finetuned-wtq"]
 };
-var data_default19 = taskData19;
+var data_default20 = taskData20;
 // src/tasks/tabular-classification/data.ts
-var taskData20 = {
+var taskData21 = {
   datasets: [
     {
       description: "A comprehensive curation of datasets covering all benchmarks.",
@@ -2748,10 +2797,10 @@ var taskData20 = {
   widgetModels: ["scikit-learn/tabular-playground"],
   youtubeId: ""
 };
-var data_default20 = taskData20;
+var data_default21 = taskData21;
 // src/tasks/tabular-regression/data.ts
-var taskData21 = {
+var taskData22 = {
   datasets: [
     {
       description: "A comprehensive curation of datasets covering all benchmarks.",
@@ -2803,10 +2852,10 @@ var taskData21 = {
   widgetModels: ["scikit-learn/Fish-Weight"],
   youtubeId: ""
 };
-var data_default21 = taskData21;
+var data_default22 = taskData22;
 // src/tasks/text-to-image/data.ts
-var taskData22 = {
+var taskData23 = {
   datasets: [
     {
       description: "RedCaps is a large-scale dataset of 12M image-text pairs collected from Reddit.",
@@ -2898,10 +2947,10 @@ var taskData22 = {
   widgetModels: ["CompVis/stable-diffusion-v1-4"],
   youtubeId: ""
 };
-var data_default22 = taskData22;
+var data_default23 = taskData23;
 // src/tasks/text-to-speech/data.ts
-var taskData23 = {
+var taskData24 = {
   canonicalId: "text-to-audio",
   datasets: [
     {
@@ -2966,10 +3015,10 @@ var taskData23 = {
   widgetModels: ["suno/bark"],
   youtubeId: "NW62DpzJ274"
 };
-var data_default23 = taskData23;
+var data_default24 = taskData24;
 // src/tasks/token-classification/data.ts
-var taskData24 = {
+var taskData25 = {
   datasets: [
     {
       description: "A widely used dataset useful to benchmark named entity recognition models.",
@@ -3045,10 +3094,10 @@ var taskData24 = {
   widgetModels: ["dslim/bert-base-NER"],
   youtubeId: "wVHdVlPScxA"
 };
-var data_default24 = taskData24;
+var data_default25 = taskData25;
 // src/tasks/translation/data.ts
-var taskData25 = {
+var taskData26 = {
   canonicalId: "text2text-generation",
   datasets: [
     {
@@ -3110,10 +3159,10 @@ var taskData25 = {
   widgetModels: ["t5-small"],
   youtubeId: "1JvfrvZgi6c"
 };
-var data_default25 = taskData25;
+var data_default26 = taskData26;
 // src/tasks/text-classification/data.ts
-var taskData26 = {
+var taskData27 = {
   datasets: [
     {
       description: "A widely used dataset used to benchmark multiple variants of text classification.",
@@ -3198,10 +3247,10 @@ var taskData26 = {
   widgetModels: ["distilbert-base-uncased-finetuned-sst-2-english"],
   youtubeId: "leNG9fN9FQU"
 };
-var data_default26 = taskData26;
+var data_default27 = taskData27;
 // src/tasks/text-generation/data.ts
-var taskData27 = {
+var taskData28 = {
   datasets: [
     {
       description: "A large multilingual dataset of text crawled from the web.",
@@ -3302,10 +3351,10 @@ var taskData27 = {
   widgetModels: ["HuggingFaceH4/zephyr-7b-beta"],
   youtubeId: "Vpjb1lu0MDk"
 };
-var data_default27 = taskData27;
+var data_default28 = taskData28;
 // src/tasks/text-to-video/data.ts
-var taskData28 = {
+var taskData29 = {
   datasets: [
     {
       description: "Microsoft Research Video to Text is a large-scale dataset for open domain video captioning",
@@ -3397,10 +3446,10 @@ var taskData28 = {
   widgetModels: [],
   youtubeId: void 0
 };
-var data_default28 = taskData28;
+var data_default29 = taskData29;
 // src/tasks/unconditional-image-generation/data.ts
-var taskData29 = {
+var taskData30 = {
   datasets: [
     {
       description: "The CIFAR-100 dataset consists of 60000 32x32 colour images in 100 classes, with 600 images per class.",
@@ -3462,10 +3511,10 @@ var taskData29 = {
   // TODO: Add related video
   youtubeId: ""
 };
-var data_default29 = taskData29;
+var data_default30 = taskData30;
 // src/tasks/video-classification/data.ts
-var taskData30 = {
+var taskData31 = {
   datasets: [
     {
       // TODO write proper description
@@ -3544,10 +3593,10 @@ var taskData30 = {
   widgetModels: [],
   youtubeId: ""
 };
-var data_default30 = taskData30;
+var data_default31 = taskData31;
 // src/tasks/visual-question-answering/data.ts
-var taskData31 = {
+var taskData32 = {
   datasets: [
     {
       description: "A widely used dataset containing questions (with answers) about images.",
@@ -3637,10 +3686,10 @@ var taskData31 = {
   widgetModels: ["dandelin/vilt-b32-finetuned-vqa"],
   youtubeId: ""
 };
-var data_default31 = taskData31;
+var data_default32 = taskData32;
 // src/tasks/zero-shot-classification/data.ts
-var taskData32 = {
+var taskData33 = {
   datasets: [
     {
       description: "A widely used dataset used to benchmark multiple variants of text classification.",
@@ -3699,10 +3748,10 @@ var taskData32 = {
   summary: "Zero-shot text classification is a task in natural language processing where a model is trained on a set of labeled examples but is then able to classify new examples from previously unseen classes.",
   widgetModels: ["facebook/bart-large-mnli"]
 };
-var data_default32 = taskData32;
+var data_default33 = taskData33;
 // src/tasks/zero-shot-image-classification/data.ts
-var taskData33 = {
+var taskData34 = {
   datasets: [
     {
       // TODO write proper description
@@ -3776,10 +3825,10 @@ var taskData33 = {
   widgetModels: ["openai/clip-vit-large-patch14-336"],
   youtubeId: ""
 };
-var data_default33 = taskData33;
+var data_default34 = taskData34;
 // src/tasks/zero-shot-object-detection/data.ts
-var taskData34 = {
+var taskData35 = {
   datasets: [],
   demo: {
     inputs: [
@@ -3834,7 +3883,7 @@ var taskData34 = {
   widgetModels: [],
   youtubeId: ""
 };
-var data_default34 = taskData34;
+var data_default35 = taskData35;
 // src/tasks/index.ts
 var TASKS_MODEL_LIBRARIES = {
@@ -3896,7 +3945,7 @@ var TASKS_MODEL_LIBRARIES = {
   "text-to-3d": [],
   "image-to-3d": []
 };
-function getData(type, partialTaskData = data_default14) {
+function getData(type, partialTaskData = data_default15) {
   return {
     ...partialTaskData,
     id: type,
@@ -3908,52 +3957,52 @@ var TASKS_DATA = {
   "audio-classification": getData("audio-classification", data_default),
   "audio-to-audio": getData("audio-to-audio", data_default2),
   "automatic-speech-recognition": getData("automatic-speech-recognition", data_default3),
-  "depth-estimation": getData("depth-estimation", data_default13),
+  "depth-estimation": getData("depth-estimation", data_default14),
   "document-question-answering": getData("document-question-answering", data_default4),
   "feature-extraction": getData("feature-extraction", data_default5),
   "fill-mask": getData("fill-mask", data_default6),
   "graph-ml": void 0,
   "image-classification": getData("image-classification", data_default7),
-  "image-segmentation": getData("image-segmentation", data_default10),
+  "image-feature-extraction": getData("image-feature-extraction", data_default8),
+  "image-segmentation": getData("image-segmentation", data_default11),
   "image-text-to-text": void 0,
-  "image-to-image": getData("image-to-image", data_default8),
-  "image-to-text": getData("image-to-text", data_default9),
+  "image-to-image": getData("image-to-image", data_default9),
+  "image-to-text": getData("image-to-text", data_default10),
   "image-to-video": void 0,
-  "mask-generation": getData("mask-generation", data_default11),
+  "mask-generation": getData("mask-generation", data_default12),
   "multiple-choice": void 0,
-  "object-detection": getData("object-detection", data_default12),
-  "video-classification": getData("video-classification", data_default30),
+  "object-detection": getData("object-detection", data_default13),
+  "video-classification": getData("video-classification", data_default31),
   other: void 0,
-  "question-answering": getData("question-answering", data_default16),
-  "reinforcement-learning": getData("reinforcement-learning", data_default15),
+  "question-answering": getData("question-answering", data_default17),
+  "reinforcement-learning": getData("reinforcement-learning", data_default16),
   robotics: void 0,
-  "sentence-similarity": getData("sentence-similarity", data_default17),
-  summarization: getData("summarization", data_default18),
-  "table-question-answering": getData("table-question-answering", data_default19),
+  "sentence-similarity": getData("sentence-similarity", data_default18),
+  summarization: getData("summarization", data_default19),
+  "table-question-answering": getData("table-question-answering", data_default20),
   "table-to-text": void 0,
-  "tabular-classification": getData("tabular-classification", data_default20),
-  "tabular-regression": getData("tabular-regression", data_default21),
+  "tabular-classification": getData("tabular-classification", data_default21),
+  "tabular-regression": getData("tabular-regression", data_default22),
   "tabular-to-text": void 0,
-  "text-classification": getData("text-classification", data_default26),
-  "text-generation": getData("text-generation", data_default27),
+  "text-classification": getData("text-classification", data_default27),
+  "text-generation": getData("text-generation", data_default28),
   "text-retrieval": void 0,
-  "text-to-image": getData("text-to-image", data_default22),
-  "text-to-speech": getData("text-to-speech", data_default23),
+  "text-to-image": getData("text-to-image", data_default23),
+  "text-to-speech": getData("text-to-speech", data_default24),
   "text-to-audio": void 0,
-  "text-to-video": getData("text-to-video", data_default28),
+  "text-to-video": getData("text-to-video", data_default29),
   "text2text-generation": void 0,
   "time-series-forecasting": void 0,
-  "token-classification": getData("token-classification", data_default24),
-  translation: getData("translation", data_default25),
-  "unconditional-image-generation": getData("unconditional-image-generation", data_default29),
-  "visual-question-answering": getData("visual-question-answering", data_default31),
+  "token-classification": getData("token-classification", data_default25),
+  translation: getData("translation", data_default26),
+  "unconditional-image-generation": getData("unconditional-image-generation", data_default30),
+  "visual-question-answering": getData("visual-question-answering", data_default32),
   "voice-activity-detection": void 0,
-  "zero-shot-classification": getData("zero-shot-classification", data_default32),
-  "zero-shot-image-classification": getData("zero-shot-image-classification", data_default33),
-  "zero-shot-object-detection": getData("zero-shot-object-detection", data_default34),
-  "text-to-3d": getData("text-to-3d", data_default14),
-  "image-to-3d": getData("image-to-3d", data_default14),
-  "image-feature-extraction": getData("image-feature-extraction", data_default14)
+  "zero-shot-classification": getData("zero-shot-classification", data_default33),
+  "zero-shot-image-classification": getData("zero-shot-image-classification", data_default34),
+  "zero-shot-object-detection": getData("zero-shot-object-detection", data_default35),
+  "text-to-3d": getData("text-to-3d", data_default15),
+  "image-to-3d": getData("image-to-3d", data_default15)
 };
 // src/model-libraries-snippets.ts
@@ -4086,6 +4135,13 @@ var keras = (model) => [
 model = from_pretrained_keras("${model.id}")
 `
 ];
+var keras_nlp = (model) => [
+  `import keras_nlp
+tokenizer = keras_nlp.models.Tokenizer.from_preset("hf://${model.id}")
+backbone = keras_nlp.models.Backbone.from_preset("hf://${model.id}")
+`
+];
 var open_clip = (model) => [
   `import open_clip
@@ -4420,6 +4476,11 @@ IWorker engine = WorkerFactory.CreateWorker(BackendType.GPUCompute, model);
 // Please see provided C# file for more details
 `
 ];
+var voicecraft = (model) => [
+  `from voicecraft import VoiceCraft
+model = VoiceCraft.from_pretrained("${model.id}")`
+];
 var mlx = (model) => [
   `pip install huggingface_hub hf_transfer
@@ -4608,6 +4669,13 @@ var MODEL_LIBRARIES_UI_ELEMENTS = {
     filter: true,
     countDownloads: { term: { path: "saved_model.pb" } }
   },
+  "keras-nlp": {
+    prettyLabel: "KerasNLP",
+    repoName: "KerasNLP",
+    repoUrl: "https://keras.io/keras_nlp/",
+    docsUrl: "https://github.com/keras-team/keras-nlp",
+    snippets: keras_nlp
+  },
   k2: {
     prettyLabel: "K2",
     repoName: "k2",
@@ -4824,6 +4892,13 @@ var MODEL_LIBRARIES_UI_ELEMENTS = {
       wildcard: { path: "*.sentis" }
     }
   },
+  voicecraft: {
+    prettyLabel: "VoiceCraft",
+    repoName: "VoiceCraft",
+    repoUrl: "https://github.com/jasonppy/VoiceCraft",
+    docsUrl: "https://github.com/jasonppy/VoiceCraft",
+    snippets: voicecraft
+  },
   whisperkit: {
     prettyLabel: "WhisperKit",
     repoName: "WhisperKit",

package/package.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
   "name": "@huggingface/tasks",
   "packageManager": "pnpm@8.10.5",
-  "version": "0.8.0",
+  "version": "0.9.0",
   "description": "List of ML tasks for huggingface.co/tasks",
   "repository": "https://github.com/huggingface/huggingface.js.git",
   "publishConfig": {

package/src/model-libraries-snippets.ts CHANGED Viewed

@@ -153,6 +153,14 @@ model = from_pretrained_keras("${model.id}")
 `,
 ];
+export const keras_nlp = (model: ModelData): string[] => [
+	`import keras_nlp
+tokenizer = keras_nlp.models.Tokenizer.from_preset("hf://${model.id}")
+backbone = keras_nlp.models.Backbone.from_preset("hf://${model.id}")
+`,
+];
 export const open_clip = (model: ModelData): string[] => [
 	`import open_clip
@@ -531,6 +539,12 @@ IWorker engine = WorkerFactory.CreateWorker(BackendType.GPUCompute, model);
 `,
 ];
+export const voicecraft = (model: ModelData): string[] => [
+	`from voicecraft import VoiceCraft
+model = VoiceCraft.from_pretrained("${model.id}")`,
+];
 export const mlx = (model: ModelData): string[] => [
 	`pip install huggingface_hub hf_transfer

package/src/model-libraries.ts CHANGED Viewed

@@ -185,6 +185,13 @@ export const MODEL_LIBRARIES_UI_ELEMENTS = {
 		filter: true,
 		countDownloads: { term: { path: "saved_model.pb" } },
 	},
+	"keras-nlp": {
+		prettyLabel: "KerasNLP",
+		repoName: "KerasNLP",
+		repoUrl: "https://keras.io/keras_nlp/",
+		docsUrl: "https://github.com/keras-team/keras-nlp",
+		snippets: snippets.keras_nlp,
+	},
 	k2: {
 		prettyLabel: "K2",
 		repoName: "k2",
@@ -401,6 +408,13 @@ export const MODEL_LIBRARIES_UI_ELEMENTS = {
 			wildcard: { path: "*.sentis" },
 		},
 	},
+	voicecraft: {
+		prettyLabel: "VoiceCraft",
+		repoName: "VoiceCraft",
+		repoUrl: "https://github.com/jasonppy/VoiceCraft",
+		docsUrl: "https://github.com/jasonppy/VoiceCraft",
+		snippets: snippets.voicecraft,
+	},
 	whisperkit: {
 		prettyLabel: "WhisperKit",
 		repoName: "WhisperKit",

package/src/tasks/feature-extraction/about.md CHANGED Viewed

@@ -1,20 +1,13 @@
-## About the Task
-Feature extraction is the task of building features intended to be informative from a given dataset,
-facilitating the subsequent learning and generalization steps in various domains of machine learning.
 ## Use Cases
-Feature extraction can be used to do transfer learning in natural language processing, computer vision and audio models.
+Models trained on a specific dataset can learn features about the data. For instance, a model trained on an English poetry dataset learns English grammar at a very high level. This information can be transferred to a new model that is going to be trained on tweets. This process of extracting features and transferring to another model is called transfer learning. One can pass their dataset through a feature extraction pipeline and feed the result to a classifier.
 ## Inference
-#### Feature Extraction
 ```python
 from transformers import pipeline
 checkpoint = "facebook/bart-base"
-feature_extractor = pipeline("feature-extraction",framework="pt",model=checkpoint)
+feature_extractor = pipeline("feature-extraction", framework="pt", model=checkpoint)
 text = "Transformers is an awesome library!"
 #Reducing along the first dimension to get a 768 dimensional array

package/src/tasks/feature-extraction/data.ts CHANGED Viewed

@@ -41,8 +41,7 @@ const taskData: TaskDataCustom = {
 		},
 	],
 	spaces: [],
-	summary:
-		"Feature extraction refers to the process of transforming raw data into numerical features that can be processed while preserving the information in the original dataset.",
+	summary: "Feature extraction is the task of extracting features learnt in a model.",
 	widgetModels: ["facebook/bart-base"],
 };

package/src/tasks/image-feature-extraction/about.md ADDED Viewed

@@ -0,0 +1,23 @@
+## Use Cases
+### Transfer Learning
+Models trained on a specific dataset can learn features about the data. For instance, a model trained on a car classification dataset learns to recognize edges and curves on a very high level and car-specific features on a low level. This information can be transferred to a new model that is going to be trained on classifying trucks. This process of extracting features and transferring to another model is called transfer learning.
+### Similarity
+Features extracted from models contain semantically meaningful information about the world. These features can be used to detect the similarity between two images. Assume there are two images: a photo of a stray cat in a street setting and a photo of a cat at home. These images both contain cats, and the features will contain the information that there's a cat in the image. Thus, comparing the features of a stray cat photo to the features of a domestic cat photo will result in higher similarity compared to any other image that doesn't contain any cats.
+## Inference
+```python
+import torch
+from transformers import pipeline
+pipe = pipeline(task="image-feature-extraction", model_name="google/vit-base-patch16-384", framework="pt", pool=True)
+pipe("https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/cats.png")
+feature_extractor(text,return_tensors = "pt")[0].numpy().mean(axis=0)
+'[[[0.21236686408519745, 1.0919708013534546, 0.8512550592422485, ...]]]'
+```