snakemake · dlaehnemann · Nov 6, 2024 · Nov 6, 2024 · Nov 6, 2024 · Nov 6, 2024
diff --git a/bio/reference/ensembl-sequence/wrapper.py b/bio/reference/ensembl-sequence/wrapper.py
@@ -47,33 +47,45 @@
 if chromosome:
     if not datatype == "dna":
         raise ValueError(
-            "invalid datatype, to select a single chromosome the datatype must be dna"
+            "Invalid datatype. To select individual chromosomes, the datatype must be dna."
         )
 
 url = snakemake.params.get("url", "ftp://ftp.ensembl.org/pub")
 spec = spec.format(build=build, release=release)
 url_prefix = f"{url}/{branch}release-{release}/fasta/{species}/{datatype}/{species.capitalize()}.{spec}"
 
-success = False
 for suffix in suffixes:
+    success = False
     url = f"{url_prefix}.{suffix}"
 
     try:
         shell("curl -sSf {url} > /dev/null 2> /dev/null")
     except sp.CalledProcessError:
-        continue
+        if chromosome:
+            print(
+                f"Unable to download the requested chromosome sequence from Ensembl at: {url_prefix}.{suffix}.",
+                file=sys.stderr,
+            )
+            break
+        else:
-        if chromosome:
-            print(
-                f"Unable to download the requested chromosome sequence from Ensembl at: {url_prefix}.{suffix}.",
-                file=sys.stderr,
-            )
-            break
-        else:
+        if chromosome:
+            shell.logger.error(
+                f"Unable to download chromosome sequence from: {url_prefix}.{suffix}"
+            )
+            continue
+        else:
-        if chromosome:
-            print(
-                f"Unable to download the requested chromosome sequence from Ensembl at: {url_prefix}.{suffix}.",
-                file=sys.stderr,
-            )
-            break
-        else:
+        if chromosome:
+            shell.logger.error(
+                f"Unable to download chromosome sequence from: {url_prefix}.{suffix}"
+            )
+            continue
+        else:
+            continue
 
     shell("(curl -L {url} | gzip -d >> {snakemake.output[0]}) {log}")
     success = True
-    break
+    if not chromosome:
+        break
 
 if not success:
-    if len(suffixes) > 1:
-        url = f"{url_prefix}.[{'|'.join(suffixes)}]"
-    else:
-        url = f"{url_prefix}.{suffixes[0]}"
+    if not chromosome:
+        if len(suffixes) > 1:
+            url = f"{url_prefix}.[{'|'.join(suffixes)}]"
+        else:
+            url = f"{url_prefix}.{suffixes[0]}"
+        print(
+            f"Unable to download the requested reference sequence data from Ensembl at: {url}.",
+            file=sys.stderr,
+        )
     print(
-        f"Unable to download requested sequence data from Ensembl ({url}). "
         "Please check whether above URL is currently available (might be a temporal server issue). "
         "Apart from that, did you check that this combination of species, build, and release is actually provided?",
         file=sys.stderr,