PyPI - udata - Versions diffs - 12.0.2.dev15__py3-none-any.whl → 13.0.1.dev21__py3-none-any.whl - Mend

udata 12.0.2.dev15py3-none-any.whl → 13.0.1.dev21py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of udata might be problematic. Click here for more details.

Files changed (258) hide show

udata/api/__init__.py +1 -0
udata/api_fields.py +10 -4
udata/app.py +11 -10
udata/auth/__init__.py +9 -10
udata/auth/mails.py +137 -45
udata/auth/views.py +5 -12
udata/commands/__init__.py +2 -3
udata/commands/info.py +1 -3
udata/commands/tests/test_fixtures.py +6 -3
udata/core/access_type/api.py +18 -0
udata/core/access_type/constants.py +98 -0
udata/core/access_type/models.py +44 -0
udata/core/activity/models.py +1 -1
udata/core/badges/models.py +1 -1
udata/core/badges/tasks.py +35 -1
udata/core/badges/tests/test_commands.py +2 -4
udata/core/badges/tests/test_model.py +2 -2
udata/core/badges/tests/test_tasks.py +55 -0
udata/core/constants.py +1 -0
udata/core/contact_point/models.py +8 -0
udata/core/dataservices/api.py +3 -3
udata/core/dataservices/apiv2.py +3 -1
udata/core/dataservices/constants.py +0 -29
udata/core/dataservices/models.py +44 -44
udata/core/dataservices/rdf.py +2 -1
udata/core/dataservices/search.py +5 -9
udata/core/dataservices/tasks.py +33 -0
udata/core/dataset/api_fields.py +11 -0
udata/core/dataset/apiv2.py +11 -0
udata/core/dataset/constants.py +0 -1
udata/core/dataset/forms.py +29 -0
udata/core/dataset/models.py +16 -4
udata/core/dataset/rdf.py +2 -1
udata/core/dataset/search.py +2 -2
udata/core/dataset/tasks.py +86 -8
udata/core/discussions/mails.py +63 -0
udata/core/discussions/tasks.py +4 -18
udata/core/metrics/__init__.py +0 -6
udata/core/organization/api.py +3 -1
udata/core/organization/mails.py +144 -0
udata/core/organization/models.py +2 -1
udata/core/organization/search.py +1 -1
udata/core/organization/tasks.py +21 -49
udata/core/pages/tests/test_api.py +0 -2
udata/core/reuse/api.py +27 -1
udata/core/reuse/mails.py +21 -0
udata/core/reuse/models.py +10 -1
udata/core/reuse/search.py +1 -1
udata/core/reuse/tasks.py +2 -3
udata/core/site/models.py +2 -6
udata/core/spatial/tests/test_api.py +17 -20
udata/core/spatial/tests/test_models.py +3 -3
udata/core/user/mails.py +54 -0
udata/core/user/models.py +2 -3
udata/core/user/tasks.py +8 -23
udata/core/user/tests/test_user_model.py +2 -6
udata/entrypoints.py +0 -5
udata/features/identicon/tests/test_backends.py +3 -13
udata/forms/fields.py +3 -3
udata/forms/widgets.py +2 -2
udata/frontend/__init__.py +3 -32
udata/harvest/actions.py +4 -9
udata/harvest/api.py +5 -14
udata/harvest/backends/__init__.py +20 -11
udata/harvest/backends/base.py +2 -2
udata/harvest/backends/ckan/harvesters.py +2 -1
udata/harvest/backends/dcat.py +3 -0
udata/harvest/backends/maaf.py +1 -0
udata/harvest/commands.py +6 -4
udata/harvest/forms.py +9 -6
udata/harvest/tasks.py +3 -5
udata/harvest/tests/ckan/test_ckan_backend.py +300 -337
udata/harvest/tests/ckan/test_ckan_backend_errors.py +94 -99
udata/harvest/tests/ckan/test_ckan_backend_filters.py +128 -122
udata/harvest/tests/ckan/test_dkan_backend.py +39 -51
udata/harvest/tests/dcat/datara--5a26b0f6-0ccf-46ad-ac58-734054b91977.rdf.xml +255 -0
udata/harvest/tests/dcat/datara--f40c3860-7236-4b30-a141-23b8ae33f7b2.rdf.xml +289 -0
udata/harvest/tests/factories.py +1 -1
udata/harvest/tests/test_actions.py +11 -9
udata/harvest/tests/test_api.py +4 -5
udata/harvest/tests/test_base_backend.py +5 -4
udata/harvest/tests/test_dcat_backend.py +50 -19
udata/harvest/tests/test_models.py +2 -4
udata/harvest/tests/test_notifications.py +2 -4
udata/harvest/tests/test_tasks.py +2 -3
udata/mail.py +90 -53
udata/migrations/2025-01-05-dataservices-fields-changes.py +8 -14
udata/migrations/2025-10-21-remove-ckan-harvest-modified-at.py +28 -0
udata/migrations/2025-10-29-harvesters-sources-integrity.py +27 -0
udata/mongo/taglist_field.py +3 -3
udata/rdf.py +32 -15
udata/sentry.py +3 -4
udata/settings.py +7 -2
udata/tags.py +5 -5
udata/tasks.py +3 -3
udata/templates/mail/message.html +65 -0
udata/templates/mail/message.txt +16 -0
udata/tests/__init__.py +40 -58
udata/tests/api/__init__.py +87 -2
udata/tests/api/test_activities_api.py +17 -23
udata/tests/api/test_auth_api.py +2 -4
udata/tests/api/test_contact_points.py +48 -54
udata/tests/api/test_dataservices_api.py +57 -37
udata/tests/api/test_datasets_api.py +146 -49
udata/tests/api/test_me_api.py +4 -6
udata/tests/api/test_organizations_api.py +19 -38
udata/tests/api/test_reports_api.py +0 -4
udata/tests/api/test_reuses_api.py +92 -19
udata/tests/api/test_security_api.py +124 -0
udata/tests/api/test_swagger.py +2 -3
udata/tests/api/test_tags_api.py +6 -7
udata/tests/api/test_transfer_api.py +0 -2
udata/tests/api/test_user_api.py +8 -10
udata/tests/apiv2/test_datasets.py +0 -4
udata/tests/apiv2/test_me_api.py +0 -2
udata/tests/apiv2/test_organizations.py +0 -2
udata/tests/apiv2/test_swagger.py +2 -3
udata/tests/apiv2/test_topics.py +0 -2
udata/tests/cli/test_cli_base.py +14 -12
udata/tests/cli/test_db_cli.py +51 -54
udata/tests/contact_point/test_contact_point_models.py +2 -2
udata/tests/dataservice/test_csv_adapter.py +2 -5
udata/tests/dataservice/test_dataservice_rdf.py +8 -6
udata/tests/dataservice/test_dataservice_tasks.py +36 -38
udata/tests/dataset/test_csv_adapter.py +2 -5
udata/tests/dataset/test_dataset_actions.py +2 -4
udata/tests/dataset/test_dataset_commands.py +2 -4
udata/tests/dataset/test_dataset_events.py +3 -3
udata/tests/dataset/test_dataset_model.py +6 -7
udata/tests/dataset/test_dataset_rdf.py +201 -12
udata/tests/dataset/test_dataset_recommendations.py +2 -2
udata/tests/dataset/test_dataset_tasks.py +66 -68
udata/tests/dataset/test_resource_preview.py +39 -48
udata/tests/dataset/test_transport_tasks.py +2 -2
udata/tests/features/territories/__init__.py +0 -6
udata/tests/features/territories/test_territories_api.py +25 -24
udata/tests/forms/test_current_user_field.py +2 -2
udata/tests/forms/test_dict_field.py +2 -4
udata/tests/forms/test_extras_fields.py +2 -3
udata/tests/forms/test_image_field.py +2 -2
udata/tests/forms/test_model_field.py +2 -4
udata/tests/forms/test_publish_as_field.py +2 -4
udata/tests/forms/test_user_forms.py +26 -29
udata/tests/frontend/test_auth.py +2 -3
udata/tests/frontend/test_csv.py +5 -6
udata/tests/frontend/test_error_handlers.py +2 -3
udata/tests/frontend/test_hooks.py +5 -7
udata/tests/frontend/test_markdown.py +3 -4
udata/tests/helpers.py +2 -7
udata/tests/metrics/test_metrics.py +52 -48
udata/tests/metrics/test_tasks.py +154 -150
udata/tests/organization/test_csv_adapter.py +2 -5
udata/tests/organization/test_notifications.py +2 -4
udata/tests/organization/test_organization_model.py +3 -4
udata/tests/organization/test_organization_rdf.py +2 -8
udata/tests/plugin.py +6 -110
udata/tests/reuse/test_reuse_model.py +3 -4
udata/tests/site/test_site_api.py +0 -2
udata/tests/site/test_site_csv_exports.py +0 -2
udata/tests/site/test_site_metrics.py +2 -4
udata/tests/site/test_site_model.py +2 -2
udata/tests/site/test_site_rdf.py +4 -7
udata/tests/test_activity.py +3 -3
udata/tests/test_api_fields.py +6 -9
udata/tests/test_cors.py +0 -2
udata/tests/test_dcat_commands.py +2 -3
udata/tests/test_discussions.py +2 -7
udata/tests/test_mail.py +150 -114
udata/tests/test_migrations.py +413 -419
udata/tests/test_model.py +10 -11
udata/tests/test_notifications.py +2 -3
udata/tests/test_owned.py +3 -3
udata/tests/test_rdf.py +19 -15
udata/tests/test_routing.py +5 -5
udata/tests/test_storages.py +6 -5
udata/tests/test_tags.py +2 -4
udata/tests/test_topics.py +2 -4
udata/tests/test_transfer.py +4 -5
udata/tests/topic/test_topic_tasks.py +25 -27
udata/tests/user/test_user_rdf.py +2 -8
udata/tests/user/test_user_tasks.py +3 -5
udata/tests/workers/test_jobs_commands.py +2 -2
udata/tests/workers/test_tasks_routing.py +27 -27
udata/translations/ar/LC_MESSAGES/udata.mo +0 -0
udata/translations/ar/LC_MESSAGES/udata.po +369 -435
udata/translations/de/LC_MESSAGES/udata.mo +0 -0
udata/translations/de/LC_MESSAGES/udata.po +371 -437
udata/translations/es/LC_MESSAGES/udata.mo +0 -0
udata/translations/es/LC_MESSAGES/udata.po +369 -435
udata/translations/fr/LC_MESSAGES/udata.mo +0 -0
udata/translations/fr/LC_MESSAGES/udata.po +381 -447
udata/translations/it/LC_MESSAGES/udata.mo +0 -0
udata/translations/it/LC_MESSAGES/udata.po +371 -437
udata/translations/pt/LC_MESSAGES/udata.mo +0 -0
udata/translations/pt/LC_MESSAGES/udata.po +371 -437
udata/translations/sr/LC_MESSAGES/udata.mo +0 -0
udata/translations/sr/LC_MESSAGES/udata.po +372 -438
udata/translations/udata.pot +379 -440
udata/utils.py +14 -2
{udata-12.0.2.dev15.dist-info → udata-13.0.1.dev21.dist-info}/METADATA +1 -2
{udata-12.0.2.dev15.dist-info → udata-13.0.1.dev21.dist-info}/RECORD +205 -242
udata/templates/mail/account_deleted.html +0 -5
udata/templates/mail/account_deleted.txt +0 -6
udata/templates/mail/account_inactivity.html +0 -40
udata/templates/mail/account_inactivity.txt +0 -31
udata/templates/mail/badge_added_association.html +0 -33
udata/templates/mail/badge_added_association.txt +0 -11
udata/templates/mail/badge_added_certified.html +0 -33
udata/templates/mail/badge_added_certified.txt +0 -11
udata/templates/mail/badge_added_company.html +0 -33
udata/templates/mail/badge_added_company.txt +0 -11
udata/templates/mail/badge_added_local_authority.html +0 -33
udata/templates/mail/badge_added_local_authority.txt +0 -11
udata/templates/mail/badge_added_public_service.html +0 -33
udata/templates/mail/badge_added_public_service.txt +0 -11
udata/templates/mail/discussion_closed.html +0 -47
udata/templates/mail/discussion_closed.txt +0 -16
udata/templates/mail/inactive_account_deleted.html +0 -5
udata/templates/mail/inactive_account_deleted.txt +0 -6
udata/templates/mail/membership_refused.html +0 -20
udata/templates/mail/membership_refused.txt +0 -11
udata/templates/mail/membership_request.html +0 -46
udata/templates/mail/membership_request.txt +0 -12
udata/templates/mail/new_discussion.html +0 -44
udata/templates/mail/new_discussion.txt +0 -15
udata/templates/mail/new_discussion_comment.html +0 -45
udata/templates/mail/new_discussion_comment.txt +0 -16
udata/templates/mail/new_member.html +0 -27
udata/templates/mail/new_member.txt +0 -11
udata/templates/mail/new_reuse.html +0 -37
udata/templates/mail/new_reuse.txt +0 -9
udata/templates/mail/test.html +0 -6
udata/templates/mail/test.txt +0 -6
udata/templates/mail/user_mail_card.html +0 -26
udata/templates/security/email/base.html +0 -105
udata/templates/security/email/base.txt +0 -6
udata/templates/security/email/button.html +0 -3
udata/templates/security/email/change_notice.html +0 -22
udata/templates/security/email/change_notice.txt +0 -8
udata/templates/security/email/confirmation_instructions.html +0 -20
udata/templates/security/email/confirmation_instructions.txt +0 -7
udata/templates/security/email/login_instructions.html +0 -19
udata/templates/security/email/login_instructions.txt +0 -7
udata/templates/security/email/reset_instructions.html +0 -24
udata/templates/security/email/reset_instructions.txt +0 -9
udata/templates/security/email/reset_notice.html +0 -11
udata/templates/security/email/reset_notice.txt +0 -4
udata/templates/security/email/welcome.html +0 -24
udata/templates/security/email/welcome.txt +0 -9
udata/templates/security/email/welcome_existing.html +0 -32
udata/templates/security/email/welcome_existing.txt +0 -14
udata/terms.md +0 -6
udata/tests/frontend/__init__.py +0 -23
udata/tests/metrics/conftest.py +0 -15
{udata-12.0.2.dev15.dist-info → udata-13.0.1.dev21.dist-info}/WHEEL +0 -0
{udata-12.0.2.dev15.dist-info → udata-13.0.1.dev21.dist-info}/entry_points.txt +0 -0
{udata-12.0.2.dev15.dist-info → udata-13.0.1.dev21.dist-info}/licenses/LICENSE +0 -0
{udata-12.0.2.dev15.dist-info → udata-13.0.1.dev21.dist-info}/top_level.txt +0 -0

udata/harvest/tests/ckan/test_ckan_backend.py CHANGED Viewed

@@ -4,7 +4,6 @@ from datetime import date
 import pytest
-from udata.app import create_app
 from udata.core.dataset.constants import UpdateFrequency
 from udata.core.organization.factories import OrganizationFactory
 from udata.core.spatial.factories import GeoZoneFactory
@@ -13,34 +12,14 @@ from udata.harvest.backends.ckan.harvesters import ALLOWED_RESOURCE_TYPES
 from udata.harvest.backends.ckan.schemas.ckan import RESOURCE_TYPES
 from udata.harvest.tests.factories import HarvestSourceFactory
 from udata.models import Dataset
-from udata.settings import Defaults, Testing
-from udata.tests.plugin import drop_db
+from udata.tests.api import PytestOnlyDBTestCase
 from udata.utils import faker
-class CkanSettings(Testing):
-    PLUGINS = ["ckan"]
 @pytest.fixture
-def app(request):
-    """Create an udata app."""
-    app = create_app(Defaults, override=CkanSettings)
-    with app.app_context():
-        drop_db(app)
-    yield app
-    with app.app_context():
-        drop_db(app)
-@pytest.fixture
-def source(app, ckan):
-    """
-    Create an harvest source for an organization.
-    """
-    with app.app_context():
-        org = OrganizationFactory()
-        return HarvestSourceFactory(backend="ckan", url=ckan.BASE_URL, organization=org)
+def source(ckan):
+    org = OrganizationFactory()
+    return HarvestSourceFactory(backend="ckan", url=ckan.BASE_URL, organization=org)
 def ckan_package(data):
@@ -72,7 +51,7 @@ def ckan_package(data):
 @pytest.fixture
-def harvest_ckan(request, source, ckan, app, rmock):
+def harvest_ckan(request, source, ckan, rmock):
     """
     This fixture performs the harvesting and return the data, result
     and kwargs for this test case
@@ -96,11 +75,10 @@ def harvest_ckan(request, source, ckan, app, rmock):
         headers={"Content-Type": "application/json"},
     )
-    with app.app_context():
-        actions.run(source)
-        source.reload()
-        job = source.get_last_job()
-        assert len(job.items) == 1
+    actions.run(source)
+    source.reload()
+    job = source.get_last_job()
+    assert len(job.items) == 1
     return data, result, kwargs
@@ -223,9 +201,8 @@ def spatial_geom_multipolygon(resource_data):
 @pytest.fixture
-def known_spatial_text_name(app, resource_data):
-    with app.app_context():
-        zone = GeoZoneFactory()
+def known_spatial_text_name(resource_data):
+    zone = GeoZoneFactory()
     data = {
         "name": faker.unique_string(),
         "title": faker.sentence(),
@@ -237,9 +214,8 @@ def known_spatial_text_name(app, resource_data):
 @pytest.fixture
-def known_spatial_text_slug(app, resource_data):
-    with app.app_context():
-        zone = GeoZoneFactory()
+def known_spatial_text_slug(resource_data):
+    zone = GeoZoneFactory()
     data = {
         "name": faker.unique_string(),
         "title": faker.sentence(),
@@ -251,10 +227,9 @@ def known_spatial_text_slug(app, resource_data):
 @pytest.fixture
-def multiple_known_spatial_text(app, resource_data):
+def multiple_known_spatial_text(resource_data):
     name = faker.word()
-    with app.app_context():
-        GeoZoneFactory.create_batch(2, name=name)
+    GeoZoneFactory.create_batch(2, name=name)
     data = {
         "name": faker.unique_string(),
         "title": faker.sentence(),
@@ -389,310 +364,298 @@ def empty_extras(resource_data):
 ##############################################################################
-@pytest.mark.ckan_data("minimal")
-def test_minimal_metadata(data, result, kwargs):
-    resource_url = kwargs["resource_url"]
-    dataset = dataset_for(result)
-    assert dataset.title == data["title"]
-    assert dataset.description == data["notes"]
-    assert dataset.harvest.remote_id == result["result"]["id"]
-    assert dataset.harvest.domain == "localhost"
-    assert dataset.harvest.ckan_name == data["name"]
-    assert len(dataset.resources) == 1
-    resource = dataset.resources[0]
-    assert resource.url == resource_url
-@pytest.mark.ckan_data("all_metadata")
-def test_all_metadata(data, result):
-    resource_data = data["resources"][0]
-    resource_result = result["result"]["resources"][0]
-    dataset = dataset_for(result)
-    assert dataset.title == data["title"]
-    assert dataset.description == data["notes"]
-    assert set(dataset.tags) == set([t["name"] for t in data["tags"]])
-    assert dataset.harvest.remote_id == result["result"]["id"]
-    assert dataset.harvest.domain == "localhost"
-    assert dataset.harvest.ckan_name == data["name"]
-    assert len(dataset.resources) == 1
-    resource = dataset.resources[0]
-    assert resource.title == resource_data["name"]
-    assert resource.description == resource_data["description"]
-    assert resource.url == resource_data["url"]
-    # Use result because format is normalized by CKAN
-    assert resource.format == resource_result["format"].lower()
-    assert resource.mime == resource_data["mimetype"].lower()
-    assert resource.harvest.issued_at.date() == date(2022, 9, 29)
-    assert resource.harvest.modified_at.date() == date(2022, 9, 30)
-@pytest.mark.ckan_data("spatial_geom_polygon")
-def test_geospatial_geom_polygon(result, kwargs):
-    polygon = kwargs["polygon"]
-    dataset = dataset_for(result)
-    assert dataset.spatial.geom == {
-        "type": "MultiPolygon",
-        "coordinates": [polygon["coordinates"]],
-    }
-@pytest.mark.ckan_data("spatial_geom_multipolygon")
-def test_geospatial_geom_multipolygon(result, kwargs):
-    multipolygon = kwargs["multipolygon"]
-    dataset = dataset_for(result)
-    assert dataset.spatial.geom == multipolygon
-@pytest.mark.ckan_data("skipped_no_resources")
-def test_skip_no_resources(source, result):
-    job = source.get_last_job()
-    item = job_item_for(job, result)
-    assert item.status == "skipped"
-    assert dataset_for(result) is None
-@pytest.mark.ckan_data("ckan_url_is_url")
-def test_ckan_url_is_url(data, result):
-    dataset = dataset_for(result)
-    assert dataset.harvest.remote_url == data["url"]
-    assert dataset.harvest.ckan_source is None
-@pytest.mark.ckan_data("ckan_url_is_a_string")
-def test_ckan_url_is_string(ckan, data, result):
-    dataset = dataset_for(result)
-    expected_url = "{0}/dataset/{1}".format(ckan.BASE_URL, data["name"])
-    assert dataset.harvest.remote_url == expected_url
-    assert dataset.harvest.ckan_source == data["url"]
-@pytest.mark.ckan_data("frequency_as_rdf_uri")
-def test_can_parse_frequency_as_uri(result, kwargs):
-    dataset = dataset_for(result)
-    assert dataset.frequency == kwargs["expected"]
-    assert "ckan:frequency" not in dataset.extras
-@pytest.mark.ckan_data("frequency_as_exact_match")
-def test_can_parse_frequency_as_exact_match(result, kwargs):
-    dataset = dataset_for(result)
-    assert dataset.frequency == kwargs["expected"]
-    assert "ckan:frequency" not in dataset.extras
-@pytest.mark.ckan_data("frequency_as_unknown_value")
-def test_can_parse_frequency_as_unknown_value(result, kwargs):
-    dataset = dataset_for(result)
-    assert dataset.extras["ckan:frequency"] == kwargs["expected"]
-    assert dataset.frequency is None
-@pytest.mark.ckan_data("empty_extras")
-def test_skip_empty_extras(result):
-    dataset = dataset_for(result)
-    assert "none" not in dataset.extras
-    assert "blank" not in dataset.extras
-    assert "spaces" not in dataset.extras
-@pytest.mark.ckan_data("known_spatial_text_name")
-def test_known_spatial_text_name(result, kwargs):
-    zone = kwargs["zone"]
-    dataset = dataset_for(result)
-    assert zone in dataset.spatial.zones
-    assert "ckan:spatial-text" not in dataset.extras
-@pytest.mark.ckan_data("known_spatial_text_slug")
-def test_known_spatial_text_slug(result, kwargs):
-    zone = kwargs["zone"]
-    dataset = dataset_for(result)
-    assert zone in dataset.spatial.zones
-    assert "ckan:spatial-text" not in dataset.extras
-@pytest.mark.ckan_data("multiple_known_spatial_text")
-def test_store_unsure_spatial_text_as_extra(result, kwargs):
-    dataset = dataset_for(result)
-    assert dataset.extras["ckan:spatial-text"] == kwargs["name"]
-    assert dataset.spatial is None
+@pytest.mark.options(HARVESTER_BACKENDS=["ckan"])
+class CkanBackendTest(PytestOnlyDBTestCase):
+    @pytest.mark.ckan_data("minimal")
+    def test_minimal_metadata(self, data, result, kwargs):
+        resource_url = kwargs["resource_url"]
+        dataset = dataset_for(result)
+        assert dataset.title == data["title"]
+        assert dataset.description == data["notes"]
+        assert dataset.harvest.remote_id == result["result"]["id"]
+        assert dataset.harvest.domain == "localhost"
+        assert dataset.harvest.ckan_name == data["name"]
+        assert len(dataset.resources) == 1
+        resource = dataset.resources[0]
+        assert resource.url == resource_url
+    @pytest.mark.ckan_data("all_metadata")
+    def test_all_metadata(self, data, result):
+        resource_data = data["resources"][0]
+        resource_result = result["result"]["resources"][0]
+        dataset = dataset_for(result)
+        assert dataset.title == data["title"]
+        assert dataset.description == data["notes"]
+        assert set(dataset.tags) == set([t["name"] for t in data["tags"]])
+        assert dataset.harvest.remote_id == result["result"]["id"]
+        assert dataset.harvest.domain == "localhost"
+        assert dataset.harvest.ckan_name == data["name"]
+        assert len(dataset.resources) == 1
+        resource = dataset.resources[0]
+        assert resource.title == resource_data["name"]
+        assert resource.description == resource_data["description"]
+        assert resource.url == resource_data["url"]
+        # Use result because format is normalized by CKAN
+        assert resource.format == resource_result["format"].lower()
+        assert resource.mime == resource_data["mimetype"].lower()
+        assert resource.harvest.issued_at.date() == date(2022, 9, 29)
+        assert resource.harvest.modified_at.date() == date(2022, 9, 30)
+    @pytest.mark.ckan_data("spatial_geom_polygon")
+    def test_geospatial_geom_polygon(self, result, kwargs):
+        polygon = kwargs["polygon"]
+        dataset = dataset_for(result)
+        assert dataset.spatial.geom == {
+            "type": "MultiPolygon",
+            "coordinates": [polygon["coordinates"]],
+        }
-@pytest.mark.ckan_data("unknown_spatial_text")
-def test_keep_unknown_spatial_text_as_extra(result, kwargs):
-    dataset = dataset_for(result)
-    assert dataset.extras["ckan:spatial-text"] == kwargs["spatial"]
-    assert dataset.spatial is None
+    @pytest.mark.ckan_data("spatial_geom_multipolygon")
+    def test_geospatial_geom_multipolygon(self, result, kwargs):
+        multipolygon = kwargs["multipolygon"]
+        dataset = dataset_for(result)
+        assert dataset.spatial.geom == multipolygon
-@pytest.mark.ckan_data("spatial_uri")
-def test_keep_unknown_spatial_uri_as_extra(result, kwargs):
-    dataset = dataset_for(result)
-    assert dataset.extras["ckan:spatial-uri"] == kwargs["spatial"]
-    assert dataset.spatial is None
+    @pytest.mark.ckan_data("skipped_no_resources")
+    def test_skip_no_resources(self, source, result):
+        job = source.get_last_job()
+        item = job_item_for(job, result)
+        assert item.status == "skipped"
+        assert dataset_for(result) is None
+    @pytest.mark.ckan_data("ckan_url_is_url")
+    def test_ckan_url_is_url(self, data, result):
+        dataset = dataset_for(result)
+        assert dataset.harvest.remote_url == data["url"]
+        assert dataset.harvest.ckan_source is None
+    @pytest.mark.ckan_data("ckan_url_is_a_string")
+    def test_ckan_url_is_string(self, ckan, data, result):
+        dataset = dataset_for(result)
+        expected_url = "{0}/dataset/{1}".format(ckan.BASE_URL, data["name"])
+        assert dataset.harvest.remote_url == expected_url
+        assert dataset.harvest.ckan_source == data["url"]
+    @pytest.mark.ckan_data("frequency_as_rdf_uri")
+    def test_can_parse_frequency_as_uri(self, result, kwargs):
+        dataset = dataset_for(result)
+        assert dataset.frequency == kwargs["expected"]
+        assert "ckan:frequency" not in dataset.extras
+    @pytest.mark.ckan_data("frequency_as_exact_match")
+    def test_can_parse_frequency_as_exact_match(self, result, kwargs):
+        dataset = dataset_for(result)
+        assert dataset.frequency == kwargs["expected"]
+        assert "ckan:frequency" not in dataset.extras
+    @pytest.mark.ckan_data("frequency_as_unknown_value")
+    def test_can_parse_frequency_as_unknown_value(self, result, kwargs):
+        dataset = dataset_for(result)
+        assert dataset.extras["ckan:frequency"] == kwargs["expected"]
+        assert dataset.frequency is None
+    @pytest.mark.ckan_data("empty_extras")
+    def test_skip_empty_extras(self, result):
+        dataset = dataset_for(result)
+        assert "none" not in dataset.extras
+        assert "blank" not in dataset.extras
+        assert "spaces" not in dataset.extras
+    @pytest.mark.ckan_data("known_spatial_text_name")
+    def test_known_spatial_text_name(self, result, kwargs):
+        zone = kwargs["zone"]
+        dataset = dataset_for(result)
+        assert zone in dataset.spatial.zones
+        assert "ckan:spatial-text" not in dataset.extras
+    @pytest.mark.ckan_data("known_spatial_text_slug")
+    def test_known_spatial_text_slug(self, result, kwargs):
+        zone = kwargs["zone"]
+        dataset = dataset_for(result)
+        assert zone in dataset.spatial.zones
+        assert "ckan:spatial-text" not in dataset.extras
+    @pytest.mark.ckan_data("multiple_known_spatial_text")
+    def test_store_unsure_spatial_text_as_extra(self, result, kwargs):
+        dataset = dataset_for(result)
+        assert dataset.extras["ckan:spatial-text"] == kwargs["name"]
+        assert dataset.spatial is None
+    @pytest.mark.ckan_data("unknown_spatial_text")
+    def test_keep_unknown_spatial_text_as_extra(self, result, kwargs):
+        dataset = dataset_for(result)
+        assert dataset.extras["ckan:spatial-text"] == kwargs["spatial"]
+        assert dataset.spatial is None
+    @pytest.mark.ckan_data("spatial_uri")
+    def test_keep_unknown_spatial_uri_as_extra(self, result, kwargs):
+        dataset = dataset_for(result)
+        assert dataset.extras["ckan:spatial-uri"] == kwargs["spatial"]
+        assert dataset.spatial is None
 ##############################################################################
 #                       Edge cases manually written                          #
 ##############################################################################
-def test_minimal_ckan_response(app, rmock):
-    """CKAN Harvester should accept the minimum dataset payload"""
-    CKAN_URL = "https://harvest.me/"
-    API_URL = "{}api/3/action/".format(CKAN_URL)
-    PACKAGE_LIST_URL = "{}package_list".format(API_URL)
-    PACKAGE_SHOW_URL = "{}package_show".format(API_URL)
-    name = faker.unique_string()
-    json = {
-        "success": True,
-        "result": minimal_data(name=name),
-    }
-    source = HarvestSourceFactory(backend="ckan", url=CKAN_URL)
-    rmock.get(
-        PACKAGE_LIST_URL,
-        json={"success": True, "result": [name]},
-        status_code=200,
-        headers={"Content-Type": "application/json"},
-    )
-    rmock.get(
-        PACKAGE_SHOW_URL,
-        json=json,
-        status_code=200,
-        headers={"Content-Type": "application/json"},
-    )
-    actions.run(source)
-    source.reload()
-    assert source.get_last_job().status == "done"
-def test_flawed_ckan_response(app, rmock):
-    """CKAN Harvester should report item error with id == remote_id in item"""
-    CKAN_URL = "https://harvest.me/"
-    API_URL = "{}api/3/action/".format(CKAN_URL)
-    PACKAGE_LIST_URL = "{}package_list".format(API_URL)
-    PACKAGE_SHOW_URL = "{}package_show".format(API_URL)
-    name = faker.unique_string()
-    _id = faker.uuid4()
-    # flawed response, missing way too much required attrs
-    json = {
-        "success": True,
-        "result": {
-            "id": _id,
-            "name": name,
-        },
-    }
-    source = HarvestSourceFactory(backend="ckan", url=CKAN_URL)
-    rmock.get(
-        PACKAGE_LIST_URL,
-        json={"success": True, "result": [name]},
-        status_code=200,
-        headers={"Content-Type": "application/json"},
-    )
-    rmock.get(
-        PACKAGE_SHOW_URL,
-        json=json,
-        status_code=200,
-        headers={"Content-Type": "application/json"},
-    )
-    actions.run(source)
-    source.reload()
-    assert source.get_last_job().status == "done-errors"
-    assert source.get_last_job().items[0].remote_id == _id
-    # flawed response, without an id, we should fallback on the name
-    json = {
-        "success": True,
-        "result": {
-            "name": name,
-        },
-    }
-    rmock.get(
-        PACKAGE_SHOW_URL,
-        json=json,
-        status_code=200,
-        headers={"Content-Type": "application/json"},
-    )
-    actions.run(source)
-    source.reload()
-    assert source.get_last_job().status == "done-errors"
-    assert source.get_last_job().items[0].remote_id == name
-@pytest.mark.options(HARVEST_MAX_ITEMS=1)
-def test_max_items(app, rmock):
-    """CKAN Harvester should report item error with id == remote_id in item"""
-    CKAN_URL = "https://harvest.me/"
-    API_URL = "{}api/3/action/".format(CKAN_URL)
-    PACKAGE_LIST_URL = "{}package_list".format(API_URL)
-    PACKAGE_SHOW_URL = "{}package_show".format(API_URL)
-    name_a = faker.unique_string()
-    name_b = faker.unique_string()
-    id_a = faker.uuid4()
-    json_a = {
-        "success": True,
-        "result": minimal_data(id=id_a, name=name_a),
-    }
-    id_b = faker.uuid4()
-    json_b = {
-        "success": True,
-        "result": minimal_data(id=id_b, name=name_b),
-    }
-    source = HarvestSourceFactory(backend="ckan", url=CKAN_URL)
-    rmock.get(
-        PACKAGE_LIST_URL,
-        json={"success": True, "result": [name_a, name_b]},
-        status_code=200,
-        headers={"Content-Type": "application/json"},
-    )
-    rmock.get(
-        f"{PACKAGE_SHOW_URL}?id={name_a}",
-        json=json_a,
-        status_code=200,
-        headers={"Content-Type": "application/json"},
-    )
-    rmock.get(
-        f"{PACKAGE_SHOW_URL}?id={name_b}",
-        json=json_b,
-        status_code=200,
-        headers={"Content-Type": "application/json"},
-    )
-    actions.run(source)
-    source.reload()
-    assert source.get_last_job().status == "done"
-    assert len(source.get_last_job().items) == 1
-    assert source.get_last_job().items[0].remote_id == id_a
-def minimal_data(**kwargs):
-    # extras and revision_id are not always present so we exclude them
-    # from the minimal payload
-    return {
-        **{
-            "id": faker.uuid4(),
-            "name": faker.uuid4(),
-            "title": faker.sentence(),
-            "maintainer": faker.name(),
-            "tags": [],
-            "private": False,
-            "maintainer_email": faker.email(),
-            "license_id": None,
-            "metadata_created": faker.iso8601(),
-            "organization": None,
-            "metadata_modified": faker.iso8601(),
-            "author": None,
-            "author_email": None,
-            "notes": faker.paragraph(),
-            "license_title": None,
-            "state": None,
-            "type": "dataset",
-            "resources": [],
-        },
-        **kwargs,
-    }
+@pytest.mark.options(HARVESTER_BACKENDS=["ckan"])
+class CkanBackendEdgeCasesTest(PytestOnlyDBTestCase):
+    def test_minimal_ckan_response(self, rmock):
+        """CKAN Harvester should accept the minimum dataset payload"""
+        CKAN_URL = "https://harvest.me/"
+        API_URL = "{}api/3/action/".format(CKAN_URL)
+        PACKAGE_LIST_URL = "{}package_list".format(API_URL)
+        PACKAGE_SHOW_URL = "{}package_show".format(API_URL)
+        name = faker.unique_string()
+        json = {
+            "success": True,
+            "result": self.minimal_data(name=name),
+        }
+        source = HarvestSourceFactory(backend="ckan", url=CKAN_URL)
+        rmock.get(
+            PACKAGE_LIST_URL,
+            json={"success": True, "result": [name]},
+            status_code=200,
+            headers={"Content-Type": "application/json"},
+        )
+        rmock.get(
+            PACKAGE_SHOW_URL,
+            json=json,
+            status_code=200,
+            headers={"Content-Type": "application/json"},
+        )
+        actions.run(source)
+        source.reload()
+        assert source.get_last_job().status == "done"
+    def test_flawed_ckan_response(self, rmock):
+        """CKAN Harvester should report item error with id == remote_id in item"""
+        CKAN_URL = "https://harvest.me/"
+        API_URL = "{}api/3/action/".format(CKAN_URL)
+        PACKAGE_LIST_URL = "{}package_list".format(API_URL)
+        PACKAGE_SHOW_URL = "{}package_show".format(API_URL)
+        name = faker.unique_string()
+        _id = faker.uuid4()
+        # flawed response, missing way too much required attrs
+        json = {
+            "success": True,
+            "result": {
+                "id": _id,
+                "name": name,
+            },
+        }
+        source = HarvestSourceFactory(backend="ckan", url=CKAN_URL)
+        rmock.get(
+            PACKAGE_LIST_URL,
+            json={"success": True, "result": [name]},
+            status_code=200,
+            headers={"Content-Type": "application/json"},
+        )
+        rmock.get(
+            PACKAGE_SHOW_URL,
+            json=json,
+            status_code=200,
+            headers={"Content-Type": "application/json"},
+        )
+        actions.run(source)
+        source.reload()
+        assert source.get_last_job().status == "done-errors"
+        assert source.get_last_job().items[0].remote_id == _id
+        # flawed response, without an id, we should fallback on the name
+        json = {
+            "success": True,
+            "result": {
+                "name": name,
+            },
+        }
+        rmock.get(
+            PACKAGE_SHOW_URL,
+            json=json,
+            status_code=200,
+            headers={"Content-Type": "application/json"},
+        )
+        actions.run(source)
+        source.reload()
+        assert source.get_last_job().status == "done-errors"
+        assert source.get_last_job().items[0].remote_id == name
+    @pytest.mark.options(HARVEST_MAX_ITEMS=1)
+    def test_max_items(self, app, rmock):
+        """CKAN Harvester should report item error with id == remote_id in item"""
+        CKAN_URL = "https://harvest.me/"
+        API_URL = "{}api/3/action/".format(CKAN_URL)
+        PACKAGE_LIST_URL = "{}package_list".format(API_URL)
+        PACKAGE_SHOW_URL = "{}package_show".format(API_URL)
+        name_a = faker.unique_string()
+        name_b = faker.unique_string()
+        id_a = faker.uuid4()
+        json_a = {
+            "success": True,
+            "result": self.minimal_data(id=id_a, name=name_a),
+        }
+        id_b = faker.uuid4()
+        json_b = {
+            "success": True,
+            "result": self.minimal_data(id=id_b, name=name_b),
+        }
+        source = HarvestSourceFactory(backend="ckan", url=CKAN_URL)
+        rmock.get(
+            PACKAGE_LIST_URL,
+            json={"success": True, "result": [name_a, name_b]},
+            status_code=200,
+            headers={"Content-Type": "application/json"},
+        )
+        rmock.get(
+            f"{PACKAGE_SHOW_URL}?id={name_a}",
+            json=json_a,
+            status_code=200,
+            headers={"Content-Type": "application/json"},
+        )
+        rmock.get(
+            f"{PACKAGE_SHOW_URL}?id={name_b}",
+            json=json_b,
+            status_code=200,
+            headers={"Content-Type": "application/json"},
+        )
+        actions.run(source)
+        source.reload()
+        assert source.get_last_job().status == "done"
+        assert len(source.get_last_job().items) == 1
+        assert source.get_last_job().items[0].remote_id == id_a
+    def minimal_data(self, **kwargs):
+        # extras and revision_id are not always present so we exclude them
+        # from the minimal payload
+        return {
+            **{
+                "id": faker.uuid4(),
+                "name": faker.uuid4(),
+                "title": faker.sentence(),
+                "maintainer": faker.name(),
+                "tags": [],
+                "private": False,
+                "maintainer_email": faker.email(),
+                "license_id": None,
+                "metadata_created": faker.iso8601(),
+                "organization": None,
+                "metadata_modified": faker.iso8601(),
+                "author": None,
+                "author_email": None,
+                "notes": faker.paragraph(),
+                "license_title": None,
+                "state": None,
+                "type": "dataset",
+                "resources": [],
+            },
+            **kwargs,
+        }

udata 12.0.2.dev15__py3-none-any.whl → 13.0.1.dev21__py3-none-any.whl

Potentially problematic release.

udata 12.0.2.dev15py3-none-any.whl → 13.0.1.dev21py3-none-any.whl