Paragraphes, lignes et expressions

Le jeu de caractères de document comprend une grande variété de caractères blancs. Beaucoup d'entre eux sont des éléments typographiques utilisées dans certaines applications pour produire des effets visuels d'espacement particulier. En HTML, seuls les caractères suivants sont définis comme des caractères blancs:







  • espace ASCII (- # X0020;)
  • onglet ASCII (- # X0009;)
  • alimentation forme ASCII (- # x000C;)
  • espace zéro largeur (- # x200B;)

Les sauts de ligne sont également des espaces blancs. Notez que bien que - # x2028; et - # x2029; sont définis dans [ISO10646] pour sans ambiguïté des lignes et des paragraphes distincts, respectivement, ceux-ci ne constituent pas des sauts de ligne dans HTML, ni cette spécification les inclure dans la catégorie plus générale des caractères blancs.

Cette spécification ne précise pas le comportement, ce qui rend ou non, des caractères d'espace autres que ceux qui sont explicitement identifiés ici comme des espaces blancs. Pour cette raison, les auteurs doivent utiliser des éléments et des styles appropriés pour obtenir des effets de mise en forme visuelle qui impliquent l'espace blanc, plutôt que des espaces.

Pour tous les éléments HTML à l'exception PRE. séquences d'espace blanc « mots » séparés (nous utilisons le terme « mot » signifie ici « séquences de caractères d'espace non-blancs »). Lorsque le formatage du texte, les agents utilisateurs doivent identifier ces mots et de les exposer selon les conventions de la langue écrite particulière (script) et support cible.

L'élément PRE est utilisé pour le texte préformaté. où l'espace blanc est significatif.

Afin d'éviter des problèmes avec les règles de saut de ligne SGML et les incohérences entre les implémentations existantes, les auteurs ne doivent pas compter sur les agents utilisateurs pour rendre l'espace blanc immédiatement après une balise de début ou immédiatement avant une balise de fin. Ainsi, les auteurs, et notamment des outils de création. devrait écrire:

9.2 Texte structuré

9.2.1 éléments de phrase: EM. FORT. DFN. CODE. SAMP. KBD. VAR. CITER. ABBR. et SIGLE

Attributs définis ailleurs

éléments de phrase ajouter des informations structurelles à des fragments de texte. Les significations habituelles des éléments de phrase suivent:

EM: Indique l'accent. FORTE: Indique davantage l'accent. CITÉ: Contient une citation ou une référence à d'autres sources. DFN: Indique que c'est l'instance la définition du terme ci-joint. CODE: Désigne un fragment de code informatique. SAMP: Désigne exemple de sortie des programmes, scripts, etc. KBD: Indique le texte à saisir par l'utilisateur. VAR: Indique une instance d'un argument variable ou programme. ABBR: Indique une forme abrégée (par exemple WWW, HTTP, URI, etc. Mass.). SIGLE: Indique un acronyme (par exemple WAC, radar, etc.).

EM et STRONG sont utilisés pour indiquer l'accent. Les autres éléments de phrase ont une importance particulière dans les documents techniques. Ces exemples illustrent quelques-uns des éléments de phrase:

Voici quelques exemples de ABBR utilisations:

Notez que les abréviations et acronymes ont souvent prononciations idiosyncrasiques. Par exemple, alors que « IRS » et « BBC » sont généralement prononcés lettre par lettre, « l'OTAN » et « UNESCO » se prononcent phonétiquement. D'autres formes abrégées (par exemple « URI » et « SQL ») sont énoncées par certains et prononcés comme mots par d'autres personnes. En cas de besoin, les auteurs doivent utiliser des feuilles de style pour spécifier la prononciation d'une forme abrégée.

9.2.2 Citations: Les éléments BLOCKQUOTE et Q

cite = uri [CT] La valeur de cet attribut est un URI qui désigne un document source ou un message. Cet attribut est destiné à donner des informations sur la source à partir de laquelle la citation a été emprunté.

Attributs définis ailleurs

Ces deux éléments désigner le texte cité. BLOCKQUOTE est pour de longues citations (contenu de niveau bloc) et Q est destiné aux courtes citations (contenu en ligne) qui ne nécessitent pas des sauts de paragraphe.







Cet exemple formate un extrait de « The Two Towers », par J.R.R. Tolkien, comme blockquote.

Les agents utilisateurs visuels rendent généralement BLOCKQUOTE comme un bloc en retrait.

L'exemple suivant illustre les citations imbriquées avec l'élément Q.

L'utilisation de BLOCKQUOTE au texte tiret est dépréciée en faveur des feuilles de style.

9.2.3 indices et les exposants: les éléments SUB et SUP

Attributs définis ailleurs

9.3 Les lignes et les paragraphes

Les auteurs divisent traditionnellement leurs pensées et leurs arguments en séquences des paragraphes. L'organisation de l'information dans les paragraphes ne sont pas affectés par la façon dont les paragraphes sont présentés: les paragraphes qui sont à double justifiées contiennent les mêmes pensées que celles qui sont justifiées à gauche.

La présentation visuelle des paragraphes est pas si simple. Un certain nombre de questions, à la fois stylistiques et techniques, doivent être abordés:

  • Traitement de l'espace blanc
  • rupture de ligne et mot emballage
  • Justification
  • césure
  • conventions de la langue écrite et directionnalité du texte
  • Mise en forme des paragraphes par rapport au contenu environnant

Nous abordons ces questions ci-dessous. L'alignement des paragraphes et des objets flottants sont discutés plus loin dans ce document.

9.3.1 Les paragraphes: l'élément P

Attributs définis ailleurs

L'élément P représente un paragraphe. Il ne peut pas contenir des éléments au niveau des blocs (y compris P lui-même).

Nous décourageons les auteurs de l'utilisation des éléments vides P. Les agents utilisateurs doivent ignorer les éléments vides P.

Un saut de ligne est définie comme étant un retour chariot (- # x000D;), un saut de ligne (- # X000A;), ou une paire de retour de chariot / ligne. Tous les sauts de ligne constituent un espace blanc.

Pour plus d'informations sur la spécification de SGML des sauts de ligne, s'il vous plaît consulter les notes sur les sauts de ligne dans l'annexe.

Forcer un saut de ligne: l'élément BR

Attributs définis ailleurs

L'élément BR brise de force (extrémités) la ligne de texte.

En ce qui concerne la mise en forme bidirectionnelle. l'élément BR doit se comporter de la même manière le caractère SEPARATOR LINE [de ISO10646] se comporte dans l'algorithme bidirectionnel.

En HTML, il existe deux types de traits d'union: le trait d'union simple et le trait d'union. Le trait d'union ordinaire doit être interprété par un agent utilisateur comme un autre caractère. Le trait d'union indique à l'agent utilisateur où un saut de ligne peut se produire.

Les navigateurs qui interprètent des traits d'union souples doivent respecter la sémantique suivante: Si une ligne est brisée à un trait d'union, doit être affiché un caractère de trait d'union à la fin de la première ligne. Si une ligne ne se décompose pas à un trait d'union, l'agent utilisateur ne doit pas afficher un caractère de trait d'union. Pour des opérations telles que la recherche et le tri, le trait d'union doit toujours être ignoré.

En HTML, le trait d'union simple est représenté par le caractère "-" (- # 45; ou - # x2D;). Le trait d'union est représenté par l'entité caractère référence -shy; (- ou - # xAD;)

9.3.4 Texte préformaté: L'élément PRE

largeur = nombre [CN] Obsolète. Cet attribut fournit une indication pour les agents utilisateurs visuels sur la largeur désirée du bloc formaté. L'agent utilisateur peut utiliser ces informations pour sélectionner une taille de police appropriée ou retrait de façon appropriée le contenu. La largeur souhaitée est exprimée en nombre de caractères. Cet attribut est pas largement pris en charge actuellement.

Attributs définis ailleurs

L'élément PRE indique aux agents utilisateurs visuels que le texte ci-joint « préformaté ». Lors de la manipulation du texte préformaté, les agents utilisateurs visuels:

les agents utilisateurs non visuels ne sont pas tenus de respecter l'espace blanc supplémentaire dans le contenu d'un élément PRE.

Pour plus d'informations sur la spécification de SGML des sauts de ligne, s'il vous plaît consulter les notes sur les sauts de ligne dans l'annexe.

L'exemple suivant montre un verset préformaté du poème de Shelly à un Skylark:

Voici comment cela est généralement rendu:

Remarque. La section suivante est une description informative du comportement de certains agents utilisateurs actuels lorsque la mise en forme des paragraphes. Les feuilles de style permettent un meilleur contrôle de la mise en forme de paragraphe.

les agents utilisateurs HTML ont toujours rendu les paragraphes avec un espace blanc avant et après, par exemple,

Dans les scripts occidentaux, par exemple, le texte ne doit être enveloppé dans un espace blanc. les agents utilisateurs premières lignes mal enveloppé juste après la balise de début ou juste avant la balise de fin d'un élément, ce qui a entraîné la ponctuation ballants. Par exemple, considérez cette phrase:

La ligne juste enroulant avant la balise de fin de l'élément A provoque la virgule à brin au début de la ligne suivante:

cite = uri [CT] La valeur de cet attribut est un URI qui désigne un document source ou un message. Cet attribut est destiné à pointer à l'information expliquant pourquoi un document a été modifié. datetime = datetime [CS] La valeur de cet attribut indique la date et l'heure de la modification.

Attributs définis ailleurs

Cet exemple pourrait être d'un projet de loi pour modifier la loi pour combien de députés un shérif du comté peut employer de 3 à 5.

Les éléments INS et DEL ne doivent pas contenir de contenu au niveau du bloc lorsque ces éléments se comportent comme des éléments en ligne.

EXEMPLE ILLEGAL:
Ce qui suit est pas HTML juridique.

Utilisé avec l'INS. cela donne:







Articles Liés