[jats-list] preformatted text in BITS 2.

Subject: [jats-list] preformatted text in BITS 2.
From: "denis.maier@xxxxxxxx" <jats-list-service@xxxxxxxxxxxxxxxxxxxxxx>
Date: Fri, 4 Nov 2022 16:14:03 -0000
Dear colleagues

Ibm bit struggling with how a should tag the following type of text:
Webre going to produce a catalog of Incunables at our institution, each
incunable will end up in its own `book-part` with the `body` looking like:

```
      <body>
        <sec>
        <p>Impressum gemC$ss Kolophon
GemC$ss GW und ISTC gedruckt in der Werkstatt des Andreas Asulanus
Foliierungsfehler: Blattzahlen 49-50 und 69-70 ausgelassen, Blattzahlen
120-121 wiederholt, zahlreiche weitere Fehler
Signaturformel: abdB9b0, eb8, fB9b0, gb8, hblB9b0, mB9B2, nbzB9b0,
[et]b6
Blatt [et]b ist unbedruckt
</p>
        <p content-type="position-3">Venedig: Bernardino Stagnino oder Andreas
Asulanus, 20.10.1492</p>
        <p content-type="position-4">235, das heisst 233 BlC$tter, 1
ungezC$hltes Blatt; 43 cm (2B0)</p>
        <p content-type="position-5"><ext-link
xlink:href=http://inkunabeln.digitale-sammlungen.de/Ausgabe_B-186.html
ext-link-type="url">BSB-Ink B-186 </ext-link>; <ext-link
xlink:href=http://www.gesamtkatalogderwiegendrucke.de/docs/GW03624.htm
ext-link-type="url">GW 03624</ext-link>; <ext-link
xlink:href=http://data.cerl.org/istc/ib00236300 ext-link-type="url">ISTC
ib00236300</ext-link></p>
        <p content-type="position-6">233 von 234 BlC$ttern (plus 2
zusC$tzliche), vorgesehene Stellen fC<r Initialen frei gelassen</p>
        <p content-type="position-7">Halbbezogener Ledereinband auf
Kartondeckeln (braun, Kalb, 18./19. Jh.) mit flC$chig eingefC$rbtem Papier
(grC<n), Linien-BlindprC$gung sowie Titelschild mit GoldprC$gung auf dem
RC<cken</p>
                               <!-- leere Elemente bitte nicht C<bertragen -->
        <p></p>
        <p></p>
        <p content-type="position-10">UnvollstC$ndiges Exemplar: Blatt 128
fehlt</p>
        <p content-type="position-11">Signatur: <ext-link
xlink:href=https://swisscollections.ch/Record/99116802840105511
  ext-link-type="url">MUE Inc I 8</ext-link></p>
        </sec>
      </body>
    </book-part>
```

Normal paragraphs are not to problem. We use `@content-type` to distinguish
between different types of paragraphs. However the `p` element that starts
with `<p>Impressum gemC$ss Kolophon` is bit tricky as this should preserve
line breaks when going HTML later. How would you deal with that kind of
requirement?

Ibve seen there is a `preformat` tag, which would sound like a good fit
here. However, the specification says this will typically be rendered in a
monospace font, which is not the case here.

Another option Ibve considered is using `verse-group` and `verse-line`
elements, like so :

```
<verse-group>
  <verse-line>Impressum gemC$ss Kolophon</verse-line>
  <verse-line>GemC$ss GW und ISTC gedruckt in der Werkstatt des Andreas
Asulanus</verse-line>
  <verse-line>Foliierungsfehler: Blattzahlen 49-50 und 69-70 ausgelassen,
Blattzahlen 120-121 wiederholt, zahlreiche weitere Fehler</verse-line>
  <verse-line>Signaturformel: abdB9b0, eb8, fB9b0, gb8, hblB9b0,
mB9B2, nbzB9b0, [et]b6 </verse-line>
  <verse-line>Blatt [et]b ist unbedruckt</verse-line>
</verse-group>
```

That way you can explicity tag each line, and also you can have proper
indentation. I donbt know if itbs just me, but I feel this here looks
wrong (content of `preformat` is left-aligned, not indented to where where the
tag startes):
```
<preformat>Impressum gemC$ss Kolophon
GemC$ss GW und ISTC gedruckt in der Werkstatt des Andreas Asulanus
Foliierungsfehler: Blattzahlen 49-50 und 69-70 ausgelassen, Blattzahlen
120-121 wiederholt, zahlreiche weitere Fehler
Signaturformel: abdB9b0, eb8, fB9b0, gb8, hblB9b0, mB9B2, nbzB9b0,
[et]b6
Blatt [et]b ist unbedruckt
</preformat>
        <p content-type="position-3">Venedig: Bernardino Stagnino oder Andreas
Asulanus, 20.10.1492</p>
```

Last option Ibve considered is using `p` elements for the individual lines,
and wrapping these in a `boxed-text` container:

```
<boxed-text >
  <p >Impressum gemC$ss Kolophon</p>
  <p>GemC$ss GW und ISTC gedruckt in der Werkstatt des Andreas Asulanus</p>
  <p>Foliierungsfehler: Blattzahlen 49-50 und 69-70 ausgelassen, Blattzahlen
120-121 wiederholt, zahlreiche weitere Fehler</p>
  <p>Signaturformel: abdB9b0, eb8, fB9b0, gb8, hblB9b0, mB9B2,
nbzB9b0, [et]b6 </p>
  <p>Blatt [et]b ist unbedruckt</p>
</boxed-text >
```

Of course, with all three options a proper attribute (`@content-type`,
`@preformat-type`) may help to add meaningful semantics.

Anyway, sorry for the long post. Is there something Ibm missing? Which
option would you choose? Is one of these options completely off the rails? Do
you see other options?

Best,
Denis

Current Thread