xemacs-beta: src/text.c annotate

author	ben
date	Wed, 13 Mar 2002 08:54:06 +0000
parents
children	026c5bf9c134

rev	line source
771 943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	1 /* Buffer manipulation primitives for XEmacs.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	2 Copyright (C) 1995 Sun Microsystems, Inc.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	3 Copyright (C) 1995, 1996, 2000, 2001, 2002 Ben Wing.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	4 Copyright (C) 1999 Martin Buchholz.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	5
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	6 This file is part of XEmacs.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	7
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	8 XEmacs is free software; you can redistribute it and/or modify it
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	9 under the terms of the GNU General Public License as published by the
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	10 Free Software Foundation; either version 2, or (at your option) any
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	11 later version.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	12
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	13 XEmacs is distributed in the hope that it will be useful, but WITHOUT
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	14 ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	15 FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	16 for more details.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	17
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	18 You should have received a copy of the GNU General Public License
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	19 along with XEmacs; see the file COPYING. If not, write to
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	20 the Free Software Foundation, Inc., 59 Temple Place - Suite 330,
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	21 Boston, MA 02111-1307, USA. */
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	22
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	23 /* Synched up with: Not in FSF. */
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	24
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	25 /* Authorship:
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	26 */
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	27
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	28 #include <config.h>
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	29 #include "lisp.h"
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	30
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	31 #include "buffer.h"
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	32 #include "charset.h"
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	33 #include "file-coding.h"
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	34 #include "lstream.h"
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	35
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	36
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	37 /************************************************************************/
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	38 /* long comments */
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	39 /************************************************************************/
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	40
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	41 /*
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	42 There are three possible ways to specify positions in a buffer. All
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	43 of these are one-based: the beginning of the buffer is position or
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	44 index 1, and 0 is not a valid position.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	45
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	46 As a "buffer position" (typedef Charbpos):
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	47
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	48 This is an index specifying an offset in characters from the
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	49 beginning of the buffer. Note that buffer positions are
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	50 logically between characters, not on a character. The
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	51 difference between two buffer positions specifies the number of
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	52 characters between those positions. Buffer positions are the
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	53 only kind of position externally visible to the user.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	54
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	55 As a "byte index" (typedef Bytebpos):
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	56
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	57 This is an index over the bytes used to represent the characters
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	58 in the buffer. If there is no Mule support, this is identical
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	59 to a buffer position, because each character is represented
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	60 using one byte. However, with Mule support, many characters
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	61 require two or more bytes for their representation, and so a
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	62 byte index may be greater than the corresponding buffer
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	63 position.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	64
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	65 As a "memory index" (typedef Membpos):
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	66
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	67 This is the byte index adjusted for the gap. For positions
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	68 before the gap, this is identical to the byte index. For
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	69 positions after the gap, this is the byte index plus the gap
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	70 size. There are two possible memory indices for the gap
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	71 position; the memory index at the beginning of the gap should
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	72 always be used, except in code that deals with manipulating the
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	73 gap, where both indices may be seen. The address of the
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	74 character "at" (i.e. following) a particular position can be
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	75 obtained from the formula
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	76
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	77 buffer_start_address + memory_index(position) - 1
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	78
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	79 except in the case of characters at the gap position.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	80
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	81 Other typedefs:
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	82 ===============
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	83
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	84 Emchar:
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	85 -------
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	86 This typedef represents a single Emacs character, which can be
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	87 ASCII, ISO-8859, or some extended character, as would typically
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	88 be used for Kanji. Note that the representation of a character
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	89 as an Emchar is not the same as the representation of that
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	90 same character in a string; thus, you cannot do the standard
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	91 C trick of passing a pointer to a character to a function that
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	92 expects a string.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	93
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	94 An Emchar takes up 19 bits of representation and (for code
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	95 compatibility and such) is compatible with an int. This
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	96 representation is visible on the Lisp level. The important
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	97 characteristics of the Emchar representation are
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	98
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	99 -- values 0x00 - 0x7f represent ASCII.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	100 -- values 0x80 - 0xff represent the right half of ISO-8859-1.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	101 -- values 0x100 and up represent all other characters.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	102
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	103 This means that Emchar values are upwardly compatible with
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	104 the standard 8-bit representation of ASCII/ISO-8859-1.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	105
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	106 Intbyte:
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	107 --------
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	108 The data in a buffer or string is logically made up of Intbyte
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	109 objects, where a Intbyte takes up the same amount of space as a
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	110 char. (It is declared differently, though, to catch invalid
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	111 usages.) Strings stored using Intbytes are said to be in
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	112 "internal format". The important characteristics of internal
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	113 format are
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	114
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	115 -- ASCII characters are represented as a single Intbyte,
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	116 in the range 0 - 0x7f.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	117 -- All other characters are represented as a Intbyte in
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	118 the range 0x80 - 0x9f followed by one or more Intbytes
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	119 in the range 0xa0 to 0xff.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	120
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	121 This leads to a number of desirable properties:
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	122
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	123 -- Given the position of the beginning of a character,
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	124 you can find the beginning of the next or previous
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	125 character in constant time.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	126 -- When searching for a substring or an ASCII character
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	127 within the string, you need merely use standard
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	128 searching routines.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	129
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	130 array of char:
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	131 --------------
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	132 Strings that go in or out of Emacs are in "external format",
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	133 typedef'ed as an array of char or a char *. There is more
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	134 than one external format (JIS, EUC, etc.) but they all
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	135 have similar properties. They are modal encodings,
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	136 which is to say that the meaning of particular bytes is
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	137 not fixed but depends on what "mode" the string is currently
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	138 in (e.g. bytes in the range 0 - 0x7f might be
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	139 interpreted as ASCII, or as Hiragana, or as 2-byte Kanji,
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	140 depending on the current mode). The mode starts out in
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	141 ASCII/ISO-8859-1 and is switched using escape sequences --
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	142 for example, in the JIS encoding, 'ESC $ B' switches to a
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	143 mode where pairs of bytes in the range 0 - 0x7f
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	144 are interpreted as Kanji characters.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	145
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	146 External-formatted data is generally desirable for passing
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	147 data between programs because it is upwardly compatible
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	148 with standard ASCII/ISO-8859-1 strings and may require
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	149 less space than internal encodings such as the one
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	150 described above. In addition, some encodings (e.g. JIS)
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	151 keep all characters (except the ESC used to switch modes)
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	152 in the printing ASCII range 0x20 - 0x7e, which results in
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	153 a much higher probability that the data will avoid being
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	154 garbled in transmission. Externally-formatted data is
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	155 generally not very convenient to work with, however, and
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	156 for this reason is usually converted to internal format
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	157 before any work is done on the string.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	158
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	159 NOTE: filenames need to be in external format so that
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	160 ISO-8859-1 characters come out correctly.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	161
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	162 Charcount:
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	163 ----------
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	164 This typedef represents a count of characters, such as
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	165 a character offset into a string or the number of
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	166 characters between two positions in a buffer. The
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	167 difference between two Charbpos's is a Charcount, and
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	168 character positions in a string are represented using
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	169 a Charcount.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	170
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	171 Bytecount:
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	172 ----------
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	173 Similar to a Charcount but represents a count of bytes.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	174 The difference between two Bytebpos's is a Bytecount.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	175
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	176
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	177 Usage of the various representations:
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	178 =====================================
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	179
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	180 Memory indices are used in low-level functions in insdel.c and for
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	181 extent endpoints and marker positions. The reason for this is that
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	182 this way, the extents and markers don't need to be updated for most
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	183 insertions, which merely shrink the gap and don't move any
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	184 characters around in memory.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	185
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	186 (The beginning-of-gap memory index simplifies insertions w.r.t.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	187 markers, because text usually gets inserted after markers. For
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	188 extents, it is merely for consistency, because text can get
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	189 inserted either before or after an extent's endpoint depending on
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	190 the open/closedness of the endpoint.)
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	191
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	192 Byte indices are used in other code that needs to be fast,
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	193 such as the searching, redisplay, and extent-manipulation code.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	194
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	195 Buffer positions are used in all other code. This is because this
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	196 representation is easiest to work with (especially since Lisp
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	197 code always uses buffer positions), necessitates the fewest
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	198 changes to existing code, and is the safest (e.g. if the text gets
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	199 shifted underneath a buffer position, it will still point to a
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	200 character; if text is shifted under a byte index, it might point
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	201 to the middle of a character, which would be bad).
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	202
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	203 Similarly, Charcounts are used in all code that deals with strings
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	204 except for code that needs to be fast, which used Bytecounts.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	205
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	206 Strings are always passed around internally using internal format.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	207 Conversions between external format are performed at the time
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	208 that the data goes in or out of Emacs.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	209
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	210 Working with the various representations:
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	211 ========================================= */
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	212
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	213 /* We write things this way because it's very important the
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	214 MAX_BYTEBPOS_GAP_SIZE_3 is a multiple of 3. (As it happens,
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	215 65535 is a multiple of 3, but this may not always be the
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	216 case.) */
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	217
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	218
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	219 /*
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	220 1. Character Sets
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	221 =================
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	222
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	223 A character set (or "charset") is an ordered set of characters.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	224 A particular character in a charset is indexed using one or
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	225 more "position codes", which are non-negative integers.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	226 The number of position codes needed to identify a particular
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	227 character in a charset is called the "dimension" of the
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	228 charset. In XEmacs/Mule, all charsets have 1 or 2 dimensions,
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	229 and the size of all charsets (except for a few special cases)
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	230 is either 94, 96, 94 by 94, or 96 by 96. The range of
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	231 position codes used to index characters from any of these
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	232 types of character sets is as follows:
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	233
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	234 Charset type Position code 1 Position code 2
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	235 ------------------------------------------------------------
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	236 94 33 - 126 N/A
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	237 96 32 - 127 N/A
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	238 94x94 33 - 126 33 - 126
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	239 96x96 32 - 127 32 - 127
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	240
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	241 Note that in the above cases position codes do not start at
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	242 an expected value such as 0 or 1. The reason for this will
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	243 become clear later.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	244
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	245 For example, Latin-1 is a 96-character charset, and JISX0208
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	246 (the Japanese national character set) is a 94x94-character
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	247 charset.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	248
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	249 [Note that, although the ranges above define the valid
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	250 position codes for a charset, some of the slots in a particular
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	251 charset may in fact be empty. This is the case for JISX0208,
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	252 for example, where (e.g.) all the slots whose first
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	253 position code is in the range 118 - 127 are empty.]
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	254
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	255 There are three charsets that do not follow the above rules.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	256 All of them have one dimension, and have ranges of position
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	257 codes as follows:
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	258
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	259 Charset name Position code 1
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	260 ------------------------------------
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	261 ASCII 0 - 127
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	262 Control-1 0 - 31
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	263 Composite 0 - some large number
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	264
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	265 (The upper bound of the position code for composite characters
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	266 has not yet been determined, but it will probably be at
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	267 least 16,383).
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	268
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	269 ASCII is the union of two subsidiary character sets:
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	270 Printing-ASCII (the printing ASCII character set,
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	271 consisting of position codes 33 - 126, like for a standard
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	272 94-character charset) and Control-ASCII (the non-printing
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	273 characters that would appear in a binary file with codes 0
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	274 - 32 and 127).
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	275
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	276 Control-1 contains the non-printing characters that would
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	277 appear in a binary file with codes 128 - 159.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	278
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	279 Composite contains characters that are generated by
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	280 overstriking one or more characters from other charsets.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	281
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	282 Note that some characters in ASCII, and all characters
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	283 in Control-1, are "control" (non-printing) characters.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	284 These have no printed representation but instead control
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	285 some other function of the printing (e.g. TAB or 8 moves
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	286 the current character position to the next tab stop).
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	287 All other characters in all charsets are "graphic"
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	288 (printing) characters.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	289
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	290 When a binary file is read in, the bytes in the file are
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	291 assigned to character sets as follows:
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	292
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	293 Bytes Character set Range
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	294 --------------------------------------------------
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	295 0 - 127 ASCII 0 - 127
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	296 128 - 159 Control-1 0 - 31
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	297 160 - 255 Latin-1 32 - 127
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	298
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	299 This is a bit ad-hoc but gets the job done.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	300
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	301 2. Encodings
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	302 ============
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	303
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	304 An "encoding" is a way of numerically representing
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	305 characters from one or more character sets. If an encoding
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	306 only encompasses one character set, then the position codes
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	307 for the characters in that character set could be used
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	308 directly. This is not possible, however, if more than one
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	309 character set is to be used in the encoding.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	310
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	311 For example, the conversion detailed above between bytes in
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	312 a binary file and characters is effectively an encoding
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	313 that encompasses the three character sets ASCII, Control-1,
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	314 and Latin-1 in a stream of 8-bit bytes.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	315
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	316 Thus, an encoding can be viewed as a way of encoding
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	317 characters from a specified group of character sets using a
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	318 stream of bytes, each of which contains a fixed number of
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	319 bits (but not necessarily 8, as in the common usage of
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	320 "byte").
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	321
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	322 Here are descriptions of a couple of common
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	323 encodings:
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	324
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	325
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	326 A. Japanese EUC (Extended Unix Code)
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	327
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	328 This encompasses the character sets:
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	329 - Printing-ASCII,
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	330 - Katakana-JISX0201 (half-width katakana, the right half of JISX0201).
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	331 - Japanese-JISX0208
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	332 - Japanese-JISX0212
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	333 It uses 8-bit bytes.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	334
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	335 Note that Printing-ASCII and Katakana-JISX0201 are 94-character
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	336 charsets, while Japanese-JISX0208 is a 94x94-character charset.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	337
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	338 The encoding is as follows:
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	339
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	340 Character set Representation (PC == position-code)
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	341 ------------- --------------
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	342 Printing-ASCII PC1
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	343 Japanese-JISX0208 PC1 + 0x80 \| PC2 + 0x80
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	344 Katakana-JISX0201 0x8E \| PC1 + 0x80
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	345
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	346
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	347 B. JIS7
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	348
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	349 This encompasses the character sets:
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	350 - Printing-ASCII
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	351 - Latin-JISX0201 (the left half of JISX0201; this character set is
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	352 very similar to Printing-ASCII and is a 94-character charset)
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	353 - Japanese-JISX0208
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	354 - Katakana-JISX0201
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	355 It uses 7-bit bytes.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	356
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	357 Unlike Japanese EUC, this is a "modal" encoding, which
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	358 means that there are multiple states that the encoding can
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	359 be in, which affect how the bytes are to be interpreted.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	360 Special sequences of bytes (called "escape sequences")
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	361 are used to change states.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	362
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	363 The encoding is as follows:
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	364
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	365 Character set Representation
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	366 ------------- --------------
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	367 Printing-ASCII PC1
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	368 Latin-JISX0201 PC1
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	369 Katakana-JISX0201 PC1
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	370 Japanese-JISX0208 PC1 \| PC2
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	371
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	372 Escape sequence ASCII equivalent Meaning
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	373 --------------- ---------------- -------
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	374 0x1B 0x28 0x42 ESC ( B invoke Printing-ASCII
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	375 0x1B 0x28 0x4A ESC ( J invoke Latin-JISX0201
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	376 0x1B 0x28 0x49 ESC ( I invoke Katakana-JISX0201
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	377 0x1B 0x24 0x42 ESC $ B invoke Japanese-JISX0208
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	378
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	379 Initially, Printing-ASCII is invoked.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	380
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	381 3. Internal Mule Encodings
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	382 ==========================
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	383
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	384 In XEmacs/Mule, each character set is assigned a unique number,
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	385 called a "leading byte". This is used in the encodings of a
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	386 character. Leading bytes are in the range 0x80 - 0xFF
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	387 (except for ASCII, which has a leading byte of 0), although
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	388 some leading bytes are reserved.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	389
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	390 Charsets whose leading byte is in the range 0x80 - 0x9F are
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	391 called "official" and are used for built-in charsets.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	392 Other charsets are called "private" and have leading bytes
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	393 in the range 0xA0 - 0xFF; these are user-defined charsets.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	394
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	395 More specifically:
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	396
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	397 Character set Leading byte
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	398 ------------- ------------
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	399 ASCII 0 (0x7F in arrays indexed by leading byte)
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	400 Composite 0x8D
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	401 Dimension-1 Official 0x80 - 0x8C/0x8D
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	402 (0x8E is free)
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	403 Control 0x8F
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	404 Dimension-2 Official 0x90 - 0x99
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	405 (0x9A - 0x9D are free)
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	406 Dimension-1 Private Marker 0x9E
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	407 Dimension-2 Private Marker 0x9F
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	408 Dimension-1 Private 0xA0 - 0xEF
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	409 Dimension-2 Private 0xF0 - 0xFF
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	410
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	411 There are two internal encodings for characters in XEmacs/Mule.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	412 One is called "string encoding" and is an 8-bit encoding that
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	413 is used for representing characters in a buffer or string.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	414 It uses 1 to 4 bytes per character. The other is called
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	415 "character encoding" and is a 19-bit encoding that is used
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	416 for representing characters individually in a variable.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	417
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	418 (In the following descriptions, we'll ignore composite
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	419 characters for the moment. We also give a general (structural)
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	420 overview first, followed later by the exact details.)
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	421
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	422 A. Internal String Encoding
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	423
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	424 ASCII characters are encoded using their position code directly.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	425 Other characters are encoded using their leading byte followed
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	426 by their position code(s) with the high bit set. Characters
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	427 in private character sets have their leading byte prefixed with
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	428 a "leading byte prefix", which is either 0x9E or 0x9F. (No
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	429 character sets are ever assigned these leading bytes.) Specifically:
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	430
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	431 Character set Encoding (PC == position-code)
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	432 ------------- -------- (LB == leading-byte)
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	433 ASCII PC1 \|
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	434 Control-1 LB \| PC1 + 0xA0
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	435 Dimension-1 official LB \| PC1 + 0x80
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	436 Dimension-1 private 0x9E \| LB \| PC1 + 0x80
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	437 Dimension-2 official LB \| PC1 \| PC2 + 0x80
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	438 Dimension-2 private 0x9F \| LB \| PC1 + 0x80 \| PC2 + 0x80
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	439
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	440 The basic characteristic of this encoding is that the first byte
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	441 of all characters is in the range 0x00 - 0x9F, and the second and
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	442 following bytes of all characters is in the range 0xA0 - 0xFF.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	443 This means that it is impossible to get out of sync, or more
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	444 specifically:
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	445
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	446 1. Given any byte position, the beginning of the character it is
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	447 within can be determined in constant time.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	448 2. Given any byte position at the beginning of a character, the
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	449 beginning of the next character can be determined in constant
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	450 time.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	451 3. Given any byte position at the beginning of a character, the
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	452 beginning of the previous character can be determined in constant
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	453 time.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	454 4. Textual searches can simply treat encoded strings as if they
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	455 were encoded in a one-byte-per-character fashion rather than
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	456 the actual multi-byte encoding.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	457
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	458 None of the standard non-modal encodings meet all of these
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	459 conditions. For example, EUC satisfies only (2) and (3), while
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	460 Shift-JIS and Big5 (not yet described) satisfy only (2). (All
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	461 non-modal encodings must satisfy (2), in order to be unambiguous.)
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	462
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	463 B. Internal Character Encoding
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	464
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	465 One 19-bit word represents a single character. The word is
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	466 separated into three fields:
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	467
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	468 Bit number: 18 17 16 15 14 13 12 11 10 09 08 07 06 05 04 03 02 01 00
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	469 <------------> <------------------> <------------------>
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	470 Field: 1 2 3
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	471
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	472 Note that fields 2 and 3 hold 7 bits each, while field 1 holds 5 bits.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	473
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	474 Character set Field 1 Field 2 Field 3
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	475 ------------- ------- ------- -------
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	476 ASCII 0 0 PC1
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	477 range: (00 - 7F)
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	478 Control-1 0 1 PC1
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	479 range: (00 - 1F)
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	480 Dimension-1 official 0 LB - 0x7F PC1
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	481 range: (01 - 0D) (20 - 7F)
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	482 Dimension-1 private 0 LB - 0x80 PC1
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	483 range: (20 - 6F) (20 - 7F)
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	484 Dimension-2 official LB - 0x8F PC1 PC2
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	485 range: (01 - 0A) (20 - 7F) (20 - 7F)
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	486 Dimension-2 private LB - 0xE1 PC1 PC2
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	487 range: (0F - 1E) (20 - 7F) (20 - 7F)
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	488 Composite 0x1F ? ?
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	489
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	490 Note that character codes 0 - 255 are the same as the "binary encoding"
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	491 described above.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	492 */
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	493
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	494 /*
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	495 About Unicode support:
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	496
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	497 Adding Unicode support is very desirable. Unicode will likely be a
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	498 very common representation in the future, and thus we should
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	499 represent Unicode characters using three bytes instead of four.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	500 This means we need to find leading bytes for Unicode. Given that

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1 /* Buffer manipulation primitives for XEmacs.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

6 This file is part of XEmacs.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

7

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

8 XEmacs is free software; you can redistribute it and/or modify it

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

9 under the terms of the GNU General Public License as published by the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

10 Free Software Foundation; either version 2, or (at your option) any

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

11 later version.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

12

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

13 XEmacs is distributed in the hope that it will be useful, but WITHOUT

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

14 ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

15 FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

16 for more details.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

17

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

18 You should have received a copy of the GNU General Public License

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

19 along with XEmacs; see the file COPYING. If not, write to

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

20 the Free Software Foundation, Inc., 59 Temple Place - Suite 330,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

21 Boston, MA 02111-1307, USA. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

22

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

23 /* Synched up with: Not in FSF. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

24

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

25 /* Authorship:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

26 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

27

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

28 #include <config.h>

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

29 #include "lisp.h"

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

30

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

31 #include "buffer.h"

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

32 #include "charset.h"

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

33 #include "file-coding.h"

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

34 #include "lstream.h"

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

35

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

36

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

37 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

38 /* long comments */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

39 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

40

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

41 /*

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

42 There are three possible ways to specify positions in a buffer. All

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

43 of these are one-based: the beginning of the buffer is position or

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

44 index 1, and 0 is not a valid position.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

45

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

46 As a "buffer position" (typedef Charbpos):

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

47

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

48 This is an index specifying an offset in characters from the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

49 beginning of the buffer. Note that buffer positions are

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

50 logically *between* characters, not on a character. The

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

51 difference between two buffer positions specifies the number of

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

52 characters between those positions. Buffer positions are the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

53 only kind of position externally visible to the user.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

54

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

55 As a "byte index" (typedef Bytebpos):

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

56

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

57 This is an index over the bytes used to represent the characters

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

58 in the buffer. If there is no Mule support, this is identical

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

59 to a buffer position, because each character is represented

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

60 using one byte. However, with Mule support, many characters

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

61 require two or more bytes for their representation, and so a

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

62 byte index may be greater than the corresponding buffer

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

63 position.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

64

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

65 As a "memory index" (typedef Membpos):

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

66

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

67 This is the byte index adjusted for the gap. For positions

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

68 before the gap, this is identical to the byte index. For

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

69 positions after the gap, this is the byte index plus the gap

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

70 size. There are two possible memory indices for the gap

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

71 position; the memory index at the beginning of the gap should

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

72 always be used, except in code that deals with manipulating the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

73 gap, where both indices may be seen. The address of the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

74 character "at" (i.e. following) a particular position can be

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

75 obtained from the formula

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

76

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

77 buffer_start_address + memory_index(position) - 1

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

78

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

79 except in the case of characters at the gap position.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

80

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

81 Other typedefs:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

82 ===============

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

83

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

84 Emchar:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

85 -------

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

86 This typedef represents a single Emacs character, which can be

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

87 ASCII, ISO-8859, or some extended character, as would typically

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

88 be used for Kanji. Note that the representation of a character

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

89 as an Emchar is *not* the same as the representation of that

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

90 same character in a string; thus, you cannot do the standard

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

91 C trick of passing a pointer to a character to a function that

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

92 expects a string.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

93

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

94 An Emchar takes up 19 bits of representation and (for code

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

95 compatibility and such) is compatible with an int. This

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

96 representation is visible on the Lisp level. The important

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

97 characteristics of the Emchar representation are

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

98

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

99 -- values 0x00 - 0x7f represent ASCII.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

100 -- values 0x80 - 0xff represent the right half of ISO-8859-1.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

101 -- values 0x100 and up represent all other characters.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

102

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

103 This means that Emchar values are upwardly compatible with

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

104 the standard 8-bit representation of ASCII/ISO-8859-1.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

105

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

106 Intbyte:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

107 --------

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

108 The data in a buffer or string is logically made up of Intbyte

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

109 objects, where a Intbyte takes up the same amount of space as a

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

110 char. (It is declared differently, though, to catch invalid

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

111 usages.) Strings stored using Intbytes are said to be in

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

112 "internal format". The important characteristics of internal

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

113 format are

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

114

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

115 -- ASCII characters are represented as a single Intbyte,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

116 in the range 0 - 0x7f.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

117 -- All other characters are represented as a Intbyte in

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

118 the range 0x80 - 0x9f followed by one or more Intbytes

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

119 in the range 0xa0 to 0xff.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

120

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

121 This leads to a number of desirable properties:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

122

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

123 -- Given the position of the beginning of a character,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

124 you can find the beginning of the next or previous

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

125 character in constant time.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

126 -- When searching for a substring or an ASCII character

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

127 within the string, you need merely use standard

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

128 searching routines.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

129

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

130 array of char:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

131 --------------

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

132 Strings that go in or out of Emacs are in "external format",

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

133 typedef'ed as an array of char or a char *. There is more

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

134 than one external format (JIS, EUC, etc.) but they all

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

135 have similar properties. They are modal encodings,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

136 which is to say that the meaning of particular bytes is

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

137 not fixed but depends on what "mode" the string is currently

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

138 in (e.g. bytes in the range 0 - 0x7f might be

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

139 interpreted as ASCII, or as Hiragana, or as 2-byte Kanji,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

140 depending on the current mode). The mode starts out in

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

141 ASCII/ISO-8859-1 and is switched using escape sequences --

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

142 for example, in the JIS encoding, 'ESC $ B' switches to a

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

143 mode where pairs of bytes in the range 0 - 0x7f

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

144 are interpreted as Kanji characters.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

145

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

146 External-formatted data is generally desirable for passing

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

147 data between programs because it is upwardly compatible

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

148 with standard ASCII/ISO-8859-1 strings and may require

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

149 less space than internal encodings such as the one

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

150 described above. In addition, some encodings (e.g. JIS)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

151 keep all characters (except the ESC used to switch modes)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

152 in the printing ASCII range 0x20 - 0x7e, which results in

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

153 a much higher probability that the data will avoid being

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

154 garbled in transmission. Externally-formatted data is

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

155 generally not very convenient to work with, however, and

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

156 for this reason is usually converted to internal format

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

157 before any work is done on the string.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

158

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

159 NOTE: filenames need to be in external format so that

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

160 ISO-8859-1 characters come out correctly.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

161

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

162 Charcount:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

163 ----------

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

164 This typedef represents a count of characters, such as

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

165 a character offset into a string or the number of

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

166 characters between two positions in a buffer. The

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

167 difference between two Charbpos's is a Charcount, and

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

168 character positions in a string are represented using

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

169 a Charcount.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

170

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

171 Bytecount:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

172 ----------

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

173 Similar to a Charcount but represents a count of bytes.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

174 The difference between two Bytebpos's is a Bytecount.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

175

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

176

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

177 Usage of the various representations:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

178 =====================================

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

179

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

180 Memory indices are used in low-level functions in insdel.c and for

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

181 extent endpoints and marker positions. The reason for this is that

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

182 this way, the extents and markers don't need to be updated for most

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

183 insertions, which merely shrink the gap and don't move any

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

184 characters around in memory.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

185

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

186 (The beginning-of-gap memory index simplifies insertions w.r.t.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

187 markers, because text usually gets inserted after markers. For

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

188 extents, it is merely for consistency, because text can get

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

189 inserted either before or after an extent's endpoint depending on

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

190 the open/closedness of the endpoint.)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

191

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

192 Byte indices are used in other code that needs to be fast,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

193 such as the searching, redisplay, and extent-manipulation code.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

194

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

195 Buffer positions are used in all other code. This is because this

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

196 representation is easiest to work with (especially since Lisp

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

197 code always uses buffer positions), necessitates the fewest

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

198 changes to existing code, and is the safest (e.g. if the text gets

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

199 shifted underneath a buffer position, it will still point to a

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

200 character; if text is shifted under a byte index, it might point

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

201 to the middle of a character, which would be bad).

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

202

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

203 Similarly, Charcounts are used in all code that deals with strings

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

204 except for code that needs to be fast, which used Bytecounts.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

205

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

206 Strings are always passed around internally using internal format.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

207 Conversions between external format are performed at the time

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

208 that the data goes in or out of Emacs.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

209

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

210 Working with the various representations:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

211 ========================================= */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

212

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

213 /* We write things this way because it's very important the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

214 MAX_BYTEBPOS_GAP_SIZE_3 is a multiple of 3. (As it happens,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

215 65535 is a multiple of 3, but this may not always be the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

216 case.) */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

217

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

218

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

219 /*

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

220 1. Character Sets

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

221 =================

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

222

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

223 A character set (or "charset") is an ordered set of characters.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

224 A particular character in a charset is indexed using one or

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

225 more "position codes", which are non-negative integers.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

226 The number of position codes needed to identify a particular

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

227 character in a charset is called the "dimension" of the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

228 charset. In XEmacs/Mule, all charsets have 1 or 2 dimensions,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

229 and the size of all charsets (except for a few special cases)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

230 is either 94, 96, 94 by 94, or 96 by 96. The range of

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

231 position codes used to index characters from any of these

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

232 types of character sets is as follows:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

233

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

234 Charset type Position code 1 Position code 2

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

235 ------------------------------------------------------------

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

236 94 33 - 126 N/A

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

237 96 32 - 127 N/A

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

238 94x94 33 - 126 33 - 126

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

239 96x96 32 - 127 32 - 127

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

240

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

241 Note that in the above cases position codes do not start at

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

242 an expected value such as 0 or 1. The reason for this will

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

243 become clear later.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

244

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

245 For example, Latin-1 is a 96-character charset, and JISX0208

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

246 (the Japanese national character set) is a 94x94-character

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

247 charset.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

248

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

249 [Note that, although the ranges above define the *valid*

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

250 position codes for a charset, some of the slots in a particular

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

251 charset may in fact be empty. This is the case for JISX0208,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

252 for example, where (e.g.) all the slots whose first

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

253 position code is in the range 118 - 127 are empty.]

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

254

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

255 There are three charsets that do not follow the above rules.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

256 All of them have one dimension, and have ranges of position

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

257 codes as follows:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

258

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

259 Charset name Position code 1

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

260 ------------------------------------

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

261 ASCII 0 - 127

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

262 Control-1 0 - 31

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

263 Composite 0 - some large number

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

264

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

265 (The upper bound of the position code for composite characters

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

266 has not yet been determined, but it will probably be at

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

267 least 16,383).

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

268

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

269 ASCII is the union of two subsidiary character sets:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

270 Printing-ASCII (the printing ASCII character set,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

271 consisting of position codes 33 - 126, like for a standard

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

272 94-character charset) and Control-ASCII (the non-printing

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

273 characters that would appear in a binary file with codes 0

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

274 - 32 and 127).

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

275

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

276 Control-1 contains the non-printing characters that would

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

277 appear in a binary file with codes 128 - 159.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

278

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

279 Composite contains characters that are generated by

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

280 overstriking one or more characters from other charsets.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

281

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

282 Note that some characters in ASCII, and all characters

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

283 in Control-1, are "control" (non-printing) characters.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

284 These have no printed representation but instead control

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

285 some other function of the printing (e.g. TAB or 8 moves

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

286 the current character position to the next tab stop).

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

287 All other characters in all charsets are "graphic"

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

288 (printing) characters.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

289

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

290 When a binary file is read in, the bytes in the file are

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

291 assigned to character sets as follows:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

292

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

293 Bytes Character set Range

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

294 --------------------------------------------------

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

295 0 - 127 ASCII 0 - 127

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

296 128 - 159 Control-1 0 - 31

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

297 160 - 255 Latin-1 32 - 127

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

298

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

299 This is a bit ad-hoc but gets the job done.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

300

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

301 2. Encodings

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

302 ============

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

303

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

304 An "encoding" is a way of numerically representing

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

305 characters from one or more character sets. If an encoding

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

306 only encompasses one character set, then the position codes

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

307 for the characters in that character set could be used

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

308 directly. This is not possible, however, if more than one

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

309 character set is to be used in the encoding.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

310

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

311 For example, the conversion detailed above between bytes in

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

312 a binary file and characters is effectively an encoding

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

313 that encompasses the three character sets ASCII, Control-1,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

314 and Latin-1 in a stream of 8-bit bytes.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

315

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

316 Thus, an encoding can be viewed as a way of encoding

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

317 characters from a specified group of character sets using a

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

318 stream of bytes, each of which contains a fixed number of

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

319 bits (but not necessarily 8, as in the common usage of

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

320 "byte").

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

321

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

322 Here are descriptions of a couple of common

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

323 encodings:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

324

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

325

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

326 A. Japanese EUC (Extended Unix Code)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

327

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

328 This encompasses the character sets:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

329 - Printing-ASCII,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

330 - Katakana-JISX0201 (half-width katakana, the right half of JISX0201).

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

331 - Japanese-JISX0208

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

332 - Japanese-JISX0212

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

333 It uses 8-bit bytes.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

334

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

335 Note that Printing-ASCII and Katakana-JISX0201 are 94-character

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

336 charsets, while Japanese-JISX0208 is a 94x94-character charset.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

337

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

338 The encoding is as follows:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

339

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

340 Character set Representation (PC == position-code)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

341 ------------- --------------

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

342 Printing-ASCII PC1

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

343 Japanese-JISX0208 PC1 + 0x80 | PC2 + 0x80

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

344 Katakana-JISX0201 0x8E | PC1 + 0x80

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

345

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

346

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

347 B. JIS7

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

348

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

349 This encompasses the character sets:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

350 - Printing-ASCII

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

351 - Latin-JISX0201 (the left half of JISX0201; this character set is

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

352 very similar to Printing-ASCII and is a 94-character charset)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

353 - Japanese-JISX0208

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

354 - Katakana-JISX0201

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

355 It uses 7-bit bytes.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

356

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

357 Unlike Japanese EUC, this is a "modal" encoding, which

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

358 means that there are multiple states that the encoding can

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

359 be in, which affect how the bytes are to be interpreted.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

360 Special sequences of bytes (called "escape sequences")

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

361 are used to change states.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

362

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

363 The encoding is as follows:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

364

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

365 Character set Representation

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

366 ------------- --------------

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

367 Printing-ASCII PC1

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

368 Latin-JISX0201 PC1

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

369 Katakana-JISX0201 PC1

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

370 Japanese-JISX0208 PC1 | PC2

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

371

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

372 Escape sequence ASCII equivalent Meaning

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

373 --------------- ---------------- -------

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

374 0x1B 0x28 0x42 ESC ( B invoke Printing-ASCII

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

375 0x1B 0x28 0x4A ESC ( J invoke Latin-JISX0201

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

376 0x1B 0x28 0x49 ESC ( I invoke Katakana-JISX0201

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

377 0x1B 0x24 0x42 ESC $ B invoke Japanese-JISX0208

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

378

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

379 Initially, Printing-ASCII is invoked.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

380

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

381 3. Internal Mule Encodings

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

382 ==========================

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

383

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

384 In XEmacs/Mule, each character set is assigned a unique number,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

385 called a "leading byte". This is used in the encodings of a

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

386 character. Leading bytes are in the range 0x80 - 0xFF

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

387 (except for ASCII, which has a leading byte of 0), although

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

388 some leading bytes are reserved.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

389

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

390 Charsets whose leading byte is in the range 0x80 - 0x9F are

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

391 called "official" and are used for built-in charsets.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

392 Other charsets are called "private" and have leading bytes

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

393 in the range 0xA0 - 0xFF; these are user-defined charsets.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

394

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

395 More specifically:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

396

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

397 Character set Leading byte

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

398 ------------- ------------

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

399 ASCII 0 (0x7F in arrays indexed by leading byte)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

400 Composite 0x8D

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

401 Dimension-1 Official 0x80 - 0x8C/0x8D

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

402 (0x8E is free)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

403 Control 0x8F

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

404 Dimension-2 Official 0x90 - 0x99

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

405 (0x9A - 0x9D are free)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

406 Dimension-1 Private Marker 0x9E

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

407 Dimension-2 Private Marker 0x9F

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

408 Dimension-1 Private 0xA0 - 0xEF

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

409 Dimension-2 Private 0xF0 - 0xFF

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

410

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

411 There are two internal encodings for characters in XEmacs/Mule.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

412 One is called "string encoding" and is an 8-bit encoding that

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

413 is used for representing characters in a buffer or string.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

414 It uses 1 to 4 bytes per character. The other is called

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

415 "character encoding" and is a 19-bit encoding that is used

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

416 for representing characters individually in a variable.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

417

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

418 (In the following descriptions, we'll ignore composite

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

419 characters for the moment. We also give a general (structural)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

420 overview first, followed later by the exact details.)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

421

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

422 A. Internal String Encoding

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

423

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

424 ASCII characters are encoded using their position code directly.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

425 Other characters are encoded using their leading byte followed

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

426 by their position code(s) with the high bit set. Characters

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

427 in private character sets have their leading byte prefixed with

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

428 a "leading byte prefix", which is either 0x9E or 0x9F. (No

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

429 character sets are ever assigned these leading bytes.) Specifically:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

430

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

431 Character set Encoding (PC == position-code)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

432 ------------- -------- (LB == leading-byte)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

433 ASCII PC1 |

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

434 Control-1 LB | PC1 + 0xA0

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

435 Dimension-1 official LB | PC1 + 0x80

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

436 Dimension-1 private 0x9E | LB | PC1 + 0x80

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

437 Dimension-2 official LB | PC1 | PC2 + 0x80

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

438 Dimension-2 private 0x9F | LB | PC1 + 0x80 | PC2 + 0x80

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

439

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

440 The basic characteristic of this encoding is that the first byte

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

441 of all characters is in the range 0x00 - 0x9F, and the second and

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

442 following bytes of all characters is in the range 0xA0 - 0xFF.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

443 This means that it is impossible to get out of sync, or more

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

444 specifically:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

445

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

446 1. Given any byte position, the beginning of the character it is

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

447 within can be determined in constant time.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

448 2. Given any byte position at the beginning of a character, the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

449 beginning of the next character can be determined in constant

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

450 time.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

451 3. Given any byte position at the beginning of a character, the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

452 beginning of the previous character can be determined in constant

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

453 time.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

454 4. Textual searches can simply treat encoded strings as if they

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

455 were encoded in a one-byte-per-character fashion rather than

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

456 the actual multi-byte encoding.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

457

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

458 None of the standard non-modal encodings meet all of these

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

459 conditions. For example, EUC satisfies only (2) and (3), while

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

460 Shift-JIS and Big5 (not yet described) satisfy only (2). (All

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

461 non-modal encodings must satisfy (2), in order to be unambiguous.)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

462

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

463 B. Internal Character Encoding

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

464

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

465 One 19-bit word represents a single character. The word is

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

466 separated into three fields:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

467

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

468 Bit number: 18 17 16 15 14 13 12 11 10 09 08 07 06 05 04 03 02 01 00

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

469 <------------> <------------------> <------------------>

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

470 Field: 1 2 3

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

471

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

472 Note that fields 2 and 3 hold 7 bits each, while field 1 holds 5 bits.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

473

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

474 Character set Field 1 Field 2 Field 3

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

475 ------------- ------- ------- -------

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

476 ASCII 0 0 PC1

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

477 range: (00 - 7F)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

478 Control-1 0 1 PC1

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

479 range: (00 - 1F)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

480 Dimension-1 official 0 LB - 0x7F PC1

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

481 range: (01 - 0D) (20 - 7F)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

482 Dimension-1 private 0 LB - 0x80 PC1

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

483 range: (20 - 6F) (20 - 7F)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

484 Dimension-2 official LB - 0x8F PC1 PC2

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

485 range: (01 - 0A) (20 - 7F) (20 - 7F)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

486 Dimension-2 private LB - 0xE1 PC1 PC2

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

487 range: (0F - 1E) (20 - 7F) (20 - 7F)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

488 Composite 0x1F ? ?

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

489

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

490 Note that character codes 0 - 255 are the same as the "binary encoding"

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

491 described above.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

492 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

493

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

494 /*

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

495 About Unicode support:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

496

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

497 Adding Unicode support is very desirable. Unicode will likely be a

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

498 very common representation in the future, and thus we should

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

499 represent Unicode characters using three bytes instead of four.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

500 This means we need to find leading bytes for Unicode. Given that

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

501 there are 65,536 characters in Unicode and we can attach 96x96 =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

502 9,216 characters per leading byte, we need eight leading bytes for

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

503 Unicode. We currently have four free (0x9A - 0x9D), and with a

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

504 little bit of rearranging we can get five: ASCII doesn't really

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

505 need to take up a leading byte. (We could just as well use 0x7F,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

506 with a little change to the functions that assume that 0x80 is the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

507 lowest leading byte.) This means we still need to dump three

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

508 leading bytes and move them into private space. The CNS charsets

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

509 are good candidates since they are rarely used, and

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

510 JAPANESE_JISX0208_1978 is becoming less and less used and could

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

511 also be dumped. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

512

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

513

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

514 /* Composite characters are characters constructed by overstriking two

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

515 or more regular characters.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

516

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

517 1) The old Mule implementation involves storing composite characters

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

518 in a buffer as a tag followed by all of the actual characters

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

519 used to make up the composite character. I think this is a bad

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

520 idea; it greatly complicates code that wants to handle strings

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

521 one character at a time because it has to deal with the possibility

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

522 of great big ungainly characters. It's much more reasonable to

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

523 simply store an index into a table of composite characters.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

524

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

525 2) The current implementation only allows for 16,384 separate

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

526 composite characters over the lifetime of the XEmacs process.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

527 This could become a potential problem if the user

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

528 edited lots of different files that use composite characters.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

529 Due to FSF bogosity, increasing the number of allowable

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

530 composite characters under Mule would decrease the number

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

531 of possible faces that can exist. Mule already has shrunk

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

532 this to 2048, and further shrinkage would become uncomfortable.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

533 No such problems exist in XEmacs.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

534

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

535 Composite characters could be represented as 0x8D C1 C2 C3,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

536 where each C[1-3] is in the range 0xA0 - 0xFF. This allows

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

537 for slightly under 2^20 (one million) composite characters

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

538 over the XEmacs process lifetime, and you only need to

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

539 increase the size of a Mule character from 19 to 21 bits.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

540 Or you could use 0x8D C1 C2 C3 C4, allowing for about

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

541 85 million (slightly over 2^26) composite characters. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

542

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

543

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

544 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

545 /* declarations */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

546 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

547

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

548 Eistring the_eistring_zero_init, the_eistring_malloc_zero_init;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

549

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

550 #define MAX_CHARBPOS_GAP_SIZE_3 (65535/3)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

551 #define MAX_BYTEBPOS_GAP_SIZE_3 (3 * MAX_CHARBPOS_GAP_SIZE_3)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

552

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

553 short three_to_one_table[1 + MAX_BYTEBPOS_GAP_SIZE_3];

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

554

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

555 #ifdef MULE

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

556

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

557 /* Table of number of bytes in the string representation of a character

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

558 indexed by the first byte of that representation.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

559

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

560 rep_bytes_by_first_byte(c) is more efficient than the equivalent

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

561 canonical computation:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

562

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

563 XCHARSET_REP_BYTES (CHARSET_BY_LEADING_BYTE (c)) */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

564

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

565 const Bytecount rep_bytes_by_first_byte[0xA0] =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

566 { /* 0x00 - 0x7f are for straight ASCII */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

567 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

568 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

569 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

570 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

571 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

572 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

573 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

574 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

575 /* 0x80 - 0x8f are for Dimension-1 official charsets */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

576 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

577 /* 0x90 - 0x9d are for Dimension-2 official charsets */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

578 /* 0x9e is for Dimension-1 private charsets */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

579 /* 0x9f is for Dimension-2 private charsets */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

580 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 4

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

581 };

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

582

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

583 #ifdef ENABLE_COMPOSITE_CHARS

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

584

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

585 /* Hash tables for composite chars. One maps string representing

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

586 composed chars to their equivalent chars; one goes the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

587 other way. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

588 Lisp_Object Vcomposite_char_char2string_hash_table;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

589 Lisp_Object Vcomposite_char_string2char_hash_table;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

590

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

591 static int composite_char_row_next;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

592 static int composite_char_col_next;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

593

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

594 #endif /* ENABLE_COMPOSITE_CHARS */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

595

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

596 #endif /* MULE */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

597

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

598

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

599 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

600 /* qxestr***() functions */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

601 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

602

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

603 /* Most are inline functions in lisp.h */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

604

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

605 int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

606 qxesprintf (Intbyte *buffer, const CIntbyte *format, ...)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

607 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

608 va_list args;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

609 int retval;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

610

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

611 va_start (args, format);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

612 retval = vsprintf ((char *) buffer, format, args);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

613 va_end (args);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

614

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

615 return retval;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

616 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

617

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

618 /* strcasecmp() implementation from BSD */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

619 static Intbyte strcasecmp_charmap[] = {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

620 '\000', '\001', '\002', '\003', '\004', '\005', '\006', '\007',

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

621 '\010', '\011', '\012', '\013', '\014', '\015', '\016', '\017',

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

622 '\020', '\021', '\022', '\023', '\024', '\025', '\026', '\027',

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

623 '\030', '\031', '\032', '\033', '\034', '\035', '\036', '\037',

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

624 '\040', '\041', '\042', '\043', '\044', '\045', '\046', '\047',

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

625 '\050', '\051', '\052', '\053', '\054', '\055', '\056', '\057',

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

626 '\060', '\061', '\062', '\063', '\064', '\065', '\066', '\067',

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

627 '\070', '\071', '\072', '\073', '\074', '\075', '\076', '\077',

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

628 '\100', '\141', '\142', '\143', '\144', '\145', '\146', '\147',

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

629 '\150', '\151', '\152', '\153', '\154', '\155', '\156', '\157',

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

630 '\160', '\161', '\162', '\163', '\164', '\165', '\166', '\167',

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

631 '\170', '\171', '\172', '\133', '\134', '\135', '\136', '\137',

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

632 '\140', '\141', '\142', '\143', '\144', '\145', '\146', '\147',

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

633 '\150', '\151', '\152', '\153', '\154', '\155', '\156', '\157',

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

634 '\160', '\161', '\162', '\163', '\164', '\165', '\166', '\167',

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

635 '\170', '\171', '\172', '\173', '\174', '\175', '\176', '\177',

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

636 '\200', '\201', '\202', '\203', '\204', '\205', '\206', '\207',

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

637 '\210', '\211', '\212', '\213', '\214', '\215', '\216', '\217',

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

638 '\220', '\221', '\222', '\223', '\224', '\225', '\226', '\227',

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

639 '\230', '\231', '\232', '\233', '\234', '\235', '\236', '\237',

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

640 '\240', '\241', '\242', '\243', '\244', '\245', '\246', '\247',

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

641 '\250', '\251', '\252', '\253', '\254', '\255', '\256', '\257',

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

642 '\260', '\261', '\262', '\263', '\264', '\265', '\266', '\267',

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

643 '\270', '\271', '\272', '\273', '\274', '\275', '\276', '\277',

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

644 '\300', '\301', '\302', '\303', '\304', '\305', '\306', '\307',

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

645 '\310', '\311', '\312', '\313', '\314', '\315', '\316', '\317',

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

646 '\320', '\321', '\322', '\323', '\324', '\325', '\326', '\327',

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

647 '\330', '\331', '\332', '\333', '\334', '\335', '\336', '\337',

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

648 '\340', '\341', '\342', '\343', '\344', '\345', '\346', '\347',

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

649 '\350', '\351', '\352', '\353', '\354', '\355', '\356', '\357',

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

650 '\360', '\361', '\362', '\363', '\364', '\365', '\366', '\367',

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

651 '\370', '\371', '\372', '\373', '\374', '\375', '\376', '\377',

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

652 };

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

653

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

654 /* A version that works like generic strcasecmp() -- only collapsing

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

655 case in ASCII A-Z/a-z. This is safe on Mule strings due to the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

656 current representation.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

657

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

658 This version was written by some Berkeley coder, favoring

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

659 nanosecond improvements over clarity. In all other versions below,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

660 we use symmetrical algorithms that may sacrifice a few machine

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

661 cycles but are MUCH MUCH clearer, which counts a lot more.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

662 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

663

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

664 int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

665 qxestrcasecmp (const Intbyte *s1, const Intbyte *s2)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

666 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

667 Intbyte *cm = strcasecmp_charmap;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

668

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

669 while (cm[*s1] == cm[*s2++])

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

670 if (*s1++ == '\0')

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

671 return (0);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

672

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

673 return (cm[*s1] - cm[*--s2]);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

674 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

675

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

676 int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

677 ascii_strcasecmp (const Char_ASCII *s1, const Char_ASCII *s2)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

678 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

679 return qxestrcasecmp ((const Intbyte *) s1, (const Intbyte *) s2);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

680 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

681

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

682 int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

683 qxestrcasecmp_c (const Intbyte *s1, const Char_ASCII *s2)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

684 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

685 return qxestrcasecmp (s1, (const Intbyte *) s2);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

686 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

687

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

688 /* An internationalized version that collapses case in a general fashion.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

689 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

690

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

691 int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

692 qxestrcasecmp_i18n (const Intbyte *s1, const Intbyte *s2)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

693 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

694 while (*s1 && *s2)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

695 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

696 if (DOWNCASE (0, charptr_emchar (s1)) !=

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

697 DOWNCASE (0, charptr_emchar (s2)))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

698 break;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

699 INC_CHARPTR (s1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

700 INC_CHARPTR (s2);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

701 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

702

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

703 return (DOWNCASE (0, charptr_emchar (s1)) -

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

704 DOWNCASE (0, charptr_emchar (s2)));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

705 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

706

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

707 /* The only difference between these next two and

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

708 qxememcasecmp()/qxememcasecmp_i18n() is that these two will stop if

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

709 both strings are equal and less than LEN in length, while

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

710 the mem...() versions would would run off the end. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

711

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

712 int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

713 qxestrncasecmp (const Intbyte *s1, const Intbyte *s2, Bytecount len)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

714 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

715 Intbyte *cm = strcasecmp_charmap;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

716

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

717 while (len--)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

718 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

719 int diff = cm[*s1] - cm[*s2];

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

720 if (diff != 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

721 return diff;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

722 if (!*s1)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

723 return 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

724 s1++, s2++;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

725 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

726

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

727 return 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

728 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

729

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

730 int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

731 ascii_strncasecmp (const Char_ASCII *s1, const Char_ASCII *s2, Bytecount len)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

732 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

733 return qxestrncasecmp ((const Intbyte *) s1, (const Intbyte *) s2, len);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

734 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

735

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

736 int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

737 qxestrncasecmp_c (const Intbyte *s1, const Char_ASCII *s2, Bytecount len)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

738 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

739 return qxestrncasecmp (s1, (const Intbyte *) s2, len);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

740 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

741

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

742 int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

743 qxestrncasecmp_i18n (const Intbyte *s1, const Intbyte *s2, Bytecount len)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

744 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

745 while (len > 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

746 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

747 const Intbyte *old_s1 = s1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

748 int diff = (DOWNCASE (0, charptr_emchar (s1)) -

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

749 DOWNCASE (0, charptr_emchar (s2)));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

750 if (diff != 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

751 return diff;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

752 if (!*s1)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

753 return 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

754 INC_CHARPTR (s1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

755 INC_CHARPTR (s2);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

756 len -= s1 - old_s1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

757 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

758

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

759 return 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

760 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

761

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

762 int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

763 qxememcmp (const Intbyte *s1, const Intbyte *s2, Bytecount len)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

764 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

765 return memcmp (s1, s2, len);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

766 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

767

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

768 int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

769 qxememcasecmp (const Intbyte *s1, const Intbyte *s2, Bytecount len)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

770 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

771 Intbyte *cm = strcasecmp_charmap;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

772

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

773 while (len--)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

774 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

775 int diff = cm[*s1] - cm[*s2];

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

776 if (diff != 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

777 return diff;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

778 s1++, s2++;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

779 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

780

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

781 return 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

782 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

783

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

784 int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

785 qxememcasecmp_i18n (const Intbyte *s1, const Intbyte *s2, Bytecount len)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

786 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

787 while (len > 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

788 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

789 const Intbyte *old_s1 = s1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

790 int diff = (DOWNCASE (0, charptr_emchar (s1)) -

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

791 DOWNCASE (0, charptr_emchar (s2)));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

792 if (diff != 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

793 return diff;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

794 INC_CHARPTR (s1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

795 INC_CHARPTR (s2);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

796 len -= s1 - old_s1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

797 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

798

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

799 return 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

800 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

801

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

802 int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

803 lisp_strcasecmp (Lisp_Object s1, Lisp_Object s2)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

804 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

805 Intbyte *cm = strcasecmp_charmap;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

806 Intbyte *p1 = XSTRING_DATA (s1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

807 Intbyte *p2 = XSTRING_DATA (s2);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

808 Intbyte *e1 = p1 + XSTRING_LENGTH (s1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

809 Intbyte *e2 = p2 + XSTRING_LENGTH (s2);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

810

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

811 /* again, we use a symmetric algorithm and favor clarity over

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

812 nanosecond improvements. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

813 while (1)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

814 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

815 /* if we reached the end of either string, compare lengths.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

816 do NOT compare the final null byte against anything, in case

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

817 the other string also has a null byte at that position. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

818 if (p1 == e1 || p2 == e2)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

819 return e1 - e2;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

820 if (cm[*p1] != cm[*p2])

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

821 return cm[*p1] - cm[*p2];

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

822 p1++, p2++;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

823 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

824 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

825

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

826 int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

827 lisp_strcasecmp_i18n (Lisp_Object s1, Lisp_Object s2)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

828 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

829 Intbyte *p1 = XSTRING_DATA (s1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

830 Intbyte *p2 = XSTRING_DATA (s2);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

831 Intbyte *e1 = p1 + XSTRING_LENGTH (s1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

832 Intbyte *e2 = p2 + XSTRING_LENGTH (s2);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

833

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

834 /* again, we use a symmetric algorithm and favor clarity over

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

835 nanosecond improvements. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

836 while (1)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

837 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

838 /* if we reached the end of either string, compare lengths.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

839 do NOT compare the final null byte against anything, in case

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

840 the other string also has a null byte at that position. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

841 assert (p1 <= e1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

842 assert (p2 <= e2);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

843 if (p1 == e1 || p2 == e2)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

844 return e1 - e2;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

845 if (DOWNCASE (0, charptr_emchar (p1)) !=

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

846 DOWNCASE (0, charptr_emchar (p2)))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

847 return (DOWNCASE (0, charptr_emchar (p1)) -

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

848 DOWNCASE (0, charptr_emchar (p2)));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

849 INC_CHARPTR (p1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

850 INC_CHARPTR (p2);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

851 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

852 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

853

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

854

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

855 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

856 /* conversion between textual representations */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

857 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

858

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

859 /* NOTE: Does not reset the Dynarr. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

860

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

861 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

862 convert_intbyte_string_into_emchar_dynarr (const Intbyte *str, Bytecount len,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

863 Emchar_dynarr *dyn)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

864 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

865 const Intbyte *strend = str + len;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

866

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

867 while (str < strend)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

868 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

869 Emchar ch = charptr_emchar (str);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

870 Dynarr_add (dyn, ch);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

871 INC_CHARPTR (str);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

872 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

873 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

874

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

875 Charcount

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

876 convert_intbyte_string_into_emchar_string (const Intbyte *str, Bytecount len,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

877 Emchar *arr)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

878 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

879 const Intbyte *strend = str + len;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

880 Charcount newlen = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

881 while (str < strend)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

882 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

883 Emchar ch = charptr_emchar (str);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

884 arr[newlen++] = ch;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

885 INC_CHARPTR (str);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

886 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

887 return newlen;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

888 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

889

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

890 /* Convert an array of Emchars into the equivalent string representation.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

891 Store into the given Intbyte dynarr. Does not reset the dynarr.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

892 Does not add a terminating zero. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

893

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

894 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

895 convert_emchar_string_into_intbyte_dynarr (Emchar *arr, int nels,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

896 Intbyte_dynarr *dyn)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

897 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

898 Intbyte str[MAX_EMCHAR_LEN];

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

899 int i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

900

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

901 for (i = 0; i < nels; i++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

902 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

903 Bytecount len = set_charptr_emchar (str, arr[i]);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

904 Dynarr_add_many (dyn, str, len);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

905 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

906 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

907

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

908 /* Convert an array of Emchars into the equivalent string representation.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

909 Malloc the space needed for this and return it. If LEN_OUT is not a

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

910 NULL pointer, store into LEN_OUT the number of Intbytes in the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

911 malloc()ed string. Note that the actual number of Intbytes allocated

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

912 is one more than this: the returned string is zero-terminated. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

913

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

914 Intbyte *

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

915 convert_emchar_string_into_malloced_string (Emchar *arr, int nels,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

916 Bytecount *len_out)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

917 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

918 /* Damn zero-termination. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

919 Intbyte *str = (Intbyte *) alloca (nels * MAX_EMCHAR_LEN + 1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

920 Intbyte *strorig = str;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

921 Bytecount len;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

922

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

923 int i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

924

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

925 for (i = 0; i < nels; i++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

926 str += set_charptr_emchar (str, arr[i]);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

927 *str = '\0';

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

928 len = str - strorig;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

929 str = (Intbyte *) xmalloc (1 + len);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

930 memcpy (str, strorig, 1 + len);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

931 if (len_out)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

932 *len_out = len;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

933 return str;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

934 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

935

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

936

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

937 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

938 /* charset properties of strings */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

939 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

940

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

941 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

942 find_charsets_in_intbyte_string (unsigned char *charsets, const Intbyte *str,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

943 Bytecount len)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

944 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

945 #ifndef MULE

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

946 /* Telescope this. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

947 charsets[0] = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

948 #else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

949 const Intbyte *strend = str + len;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

950 memset (charsets, 0, NUM_LEADING_BYTES);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

951

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

952 /* #### SJT doesn't like this. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

953 if (len == 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

954 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

955 charsets[XCHARSET_LEADING_BYTE (Vcharset_ascii) - MIN_LEADING_BYTE] = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

956 return;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

957 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

958

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

959 while (str < strend)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

960 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

961 charsets[CHAR_LEADING_BYTE (charptr_emchar (str)) - MIN_LEADING_BYTE] =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

962 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

963 INC_CHARPTR (str);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

964 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

965 #endif

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

966 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

967

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

968 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

969 find_charsets_in_emchar_string (unsigned char *charsets, const Emchar *str,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

970 Charcount len)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

971 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

972 #ifndef MULE

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

973 /* Telescope this. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

974 charsets[0] = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

975 #else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

976 int i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

977

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

978 memset (charsets, 0, NUM_LEADING_BYTES);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

979

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

980 /* #### SJT doesn't like this. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

981 if (len == 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

982 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

983 charsets[XCHARSET_LEADING_BYTE (Vcharset_ascii) - MIN_LEADING_BYTE] = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

984 return;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

985 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

986

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

987 for (i = 0; i < len; i++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

988 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

989 charsets[CHAR_LEADING_BYTE (str[i]) - MIN_LEADING_BYTE] = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

990 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

991 #endif

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

992 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

993

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

994 int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

995 intbyte_string_displayed_columns (const Intbyte *str, Bytecount len)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

996 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

997 int cols = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

998 const Intbyte *end = str + len;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

999

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1000 while (str < end)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1001 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1002 #ifdef MULE

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1003 Emchar ch = charptr_emchar (str);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1004 cols += XCHARSET_COLUMNS (CHAR_CHARSET (ch));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1005 #else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1006 cols++;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1007 #endif

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1008 INC_CHARPTR (str);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1009 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1010

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1011 return cols;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1012 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1013

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1014 int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1015 emchar_string_displayed_columns (const Emchar *str, Charcount len)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1016 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1017 #ifdef MULE

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1018 int cols = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1019 int i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1020

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1021 for (i = 0; i < len; i++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1022 cols += XCHARSET_COLUMNS (CHAR_CHARSET (str[i]));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1023

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1024 return cols;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1025 #else /* not MULE */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1026 return len;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1027 #endif

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1028 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1029

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1030 Charcount

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1031 intbyte_string_nonascii_chars (const Intbyte *str, Bytecount len)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1032 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1033 #ifdef MULE

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1034 const Intbyte *end = str + len;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1035 Charcount retval = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1036

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1037 while (str < end)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1038 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1039 if (!BYTE_ASCII_P (*str))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1040 retval++;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1041 INC_CHARPTR (str);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1042 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1043

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1044 return retval;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1045 #else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1046 return 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1047 #endif

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1048 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1049

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1050

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1051 /***************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1052 /* Eistring helper functions */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1053 /***************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1054

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1055 int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1056 eistr_casefiddle_1 (Intbyte *olddata, Bytecount len, Intbyte *newdata,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1057 int downp)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1058 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1059 Intbyte *endp = olddata + len;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1060 Intbyte *newp = newdata;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1061 int changedp = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1062

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1063 while (olddata < endp)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1064 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1065 Emchar c = charptr_emchar (olddata);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1066 Emchar newc;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1067

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1068 if (downp)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1069 newc = DOWNCASE (0, c);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1070 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1071 newc = UPCASE (0, c);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1072

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1073 if (c != newc)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1074 changedp = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1075

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1076 newp += set_charptr_emchar (newp, newc);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1077 INC_CHARPTR (olddata);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1078 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1079

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1080 *newp = '\0';

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1081

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1082 return changedp ? newp - newdata : 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1083 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1084

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1085 int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1086 eifind_large_enough_buffer (int oldbufsize, int needed_size)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1087 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1088 while (oldbufsize < needed_size)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1089 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1090 oldbufsize = oldbufsize * 3 / 2;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1091 oldbufsize = max (oldbufsize, 32);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1092 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1093

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1094 return oldbufsize;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1095 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1096

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1097 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1098 eito_malloc_1 (Eistring *ei)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1099 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1100 if (ei->mallocp_)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1101 return;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1102 ei->mallocp_ = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1103 if (ei->data_)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1104 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1105 Intbyte *newdata;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1106

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1107 ei->max_size_allocated_ =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1108 eifind_large_enough_buffer (0, ei->bytelen_ + 1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1109 newdata = (Intbyte *) xmalloc (ei->max_size_allocated_);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1110 memcpy (newdata, ei->data_, ei->bytelen_ + 1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1111 ei->data_ = newdata;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1112 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1113

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1114 if (ei->extdata_)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1115 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1116 Extbyte *newdata = (Extbyte *) xmalloc (ei->extlen_ + 2);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1117

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1118 memcpy (newdata, ei->extdata_, ei->extlen_);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1119 /* Double null-terminate in case of Unicode data */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1120 newdata[ei->extlen_] = '\0';

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1121 newdata[ei->extlen_ + 1] = '\0';

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1122 ei->extdata_ = newdata;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1123 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1124 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1125

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1126 int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1127 eicmp_1 (Eistring *ei, Bytecount off, Charcount charoff,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1128 Bytecount len, Charcount charlen, const Intbyte *data,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1129 const Eistring *ei2, int is_c, int fold_case)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1130 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1131 assert ((off < 0) != (charoff < 0));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1132 if (off < 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1133 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1134 off = charcount_to_bytecount (ei->data_, charoff);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1135 if (charlen < 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1136 len = -1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1137 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1138 len = charcount_to_bytecount (ei->data_ + off, charlen);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1139 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1140 if (len < 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1141 len = ei->bytelen_ - off;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1142

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1143 assert (off >= 0 && off <= ei->bytelen_);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1144 assert (len >= 0 && off + len <= ei->bytelen_);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1145 assert ((data == 0) != (ei == 0));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1146 assert ((is_c != 0) == (data != 0));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1147 assert (fold_case >= 0 && fold_case <= 2);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1148

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1149 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1150 Bytecount dstlen;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1151 int result;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1152 const Intbyte *src = ei->data_, *dst;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1153 Bytecount cmplen;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1154

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1155 if (data)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1156 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1157 dst = data;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1158 dstlen = qxestrlen (data);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1159 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1160 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1161 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1162 dst = ei2->data_;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1163 dstlen = ei2->bytelen_;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1164 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1165

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1166 if (is_c)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1167 EI_ASSERT_ASCII ((Char_ASCII *) dst, dstlen);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1168

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1169 cmplen = min (len, dstlen);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1170 result = (fold_case == 0 ? qxememcmp (src, dst, cmplen) :

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1171 fold_case == 1 ? qxememcasecmp (src, dst, cmplen) :

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1172 qxememcasecmp_i18n (src, dst, cmplen));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1173

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1174 if (result)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1175 return result;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1176

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1177 return len - dstlen;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1178 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1179 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1180

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1181 Intbyte *

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1182 eicpyout_malloc_fmt (Eistring *eistr, Bytecount *len_out, Internal_Format fmt)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1183 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1184 Intbyte *ptr;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1185

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1186 assert (fmt == FORMAT_DEFAULT);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1187 ptr = xnew_array (Intbyte, eistr->bytelen_ + 1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1188 if (len_out)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1189 *len_out = eistr->bytelen_;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1190 memcpy (ptr, eistr->data_, eistr->bytelen_ + 1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1191 return ptr;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1192 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1193

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1194

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1195 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1196 /* Charcount/Bytecount conversion */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1197 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1198

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1199 /* Optimization. Do it. Live it. Love it. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1200

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1201 #ifdef MULE

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1202

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1203 /* We include the basic functions here that require no specific

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1204 knowledge of how data is Mule-encoded into a buffer other

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1205 than the basic (00 - 7F), (80 - 9F), (A0 - FF) scheme.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1206 Anything that requires more specific knowledge goes into

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1207 mule-charset.c. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1208

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1209 /* Given a pointer to a text string and a length in bytes, return

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1210 the equivalent length in characters. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1211

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1212 Charcount

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1213 bytecount_to_charcount (const Intbyte *ptr, Bytecount len)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1214 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1215 Charcount count = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1216 const Intbyte *end = ptr + len;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1217

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1218 #if SIZEOF_LONG == 8

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1219 # define STRIDE_TYPE long

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1220 # define HIGH_BIT_MASK 0x8080808080808080UL

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1221 #elif SIZEOF_LONG_LONG == 8 && !(defined (i386) || defined (__i386__))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1222 # define STRIDE_TYPE long long

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1223 # define HIGH_BIT_MASK 0x8080808080808080ULL

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1224 #elif SIZEOF_LONG == 4

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1225 # define STRIDE_TYPE long

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1226 # define HIGH_BIT_MASK 0x80808080UL

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1227 #else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1228 # error Add support for 128-bit systems here

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1229 #endif

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1230

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1231 #define ALIGN_BITS ((EMACS_UINT) (ALIGNOF (STRIDE_TYPE) - 1))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1232 #define ALIGN_MASK (~ ALIGN_BITS)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1233 #define ALIGNED(ptr) ((((EMACS_UINT) ptr) & ALIGN_BITS) == 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1234 #define STRIDE sizeof (STRIDE_TYPE)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1235

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1236 while (ptr < end)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1237 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1238 if (BYTE_ASCII_P (*ptr))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1239 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1240 /* optimize for long stretches of ASCII */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1241 if (! ALIGNED (ptr))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1242 ptr++, count++;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1243 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1244 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1245 const unsigned STRIDE_TYPE *ascii_end =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1246 (const unsigned STRIDE_TYPE *) ptr;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1247 /* This loop screams, because we can detect ASCII

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1248 characters 4 or 8 at a time. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1249 while ((const Intbyte *) ascii_end + STRIDE <= end

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1250 && !(*ascii_end & HIGH_BIT_MASK))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1251 ascii_end++;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1252 if ((Intbyte *) ascii_end == ptr)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1253 ptr++, count++;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1254 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1255 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1256 count += (Intbyte *) ascii_end - ptr;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1257 ptr = (Intbyte *) ascii_end;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1258 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1259 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1260 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1261 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1262 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1263 /* optimize for successive characters from the same charset */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1264 Intbyte leading_byte = *ptr;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1265 int bytes = REP_BYTES_BY_FIRST_BYTE (leading_byte);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1266 while ((ptr < end) && (*ptr == leading_byte))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1267 ptr += bytes, count++;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1268 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1269 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1270

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1271 /* Bomb out if the specified substring ends in the middle

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1272 of a character. Note that we might have already gotten

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1273 a core dump above from an invalid reference, but at least

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1274 we will get no farther than here.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1275

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1276 This also catches len < 0. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1277 charbpos_checking_assert (ptr == end);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1278

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1279 return count;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1280 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1281

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1282 /* Given a pointer to a text string and a length in characters, return

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1283 the equivalent length in bytes. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1284

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1285 Bytecount

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1286 charcount_to_bytecount (const Intbyte *ptr, Charcount len)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1287 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1288 const Intbyte *newptr = ptr;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1289

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1290 charbpos_checking_assert (len >= 0);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1291 while (len > 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1292 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1293 INC_CHARPTR (newptr);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1294 len--;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1295 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1296 return newptr - ptr;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1297 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1298

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1299 inline static void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1300 update_entirely_ascii_p_flag (struct buffer *buf)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1301 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1302 buf->text->entirely_ascii_p =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1303 (buf->text->mule_bufmin == 1 &&

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1304 buf->text->mule_bufmax == buf->text->bufz &&

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1305 !buf->text->mule_shifter &&

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1306 !buf->text->mule_three_p);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1307 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1308

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1309 /* The next two functions are the actual meat behind the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1310 charbpos-to-bytebpos and bytebpos-to-charbpos conversions. Currently

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1311 the method they use is fairly unsophisticated; see buffer.h.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1312

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1313 Note that charbpos_to_bytebpos_func() is probably the most-called

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1314 function in all of XEmacs. Therefore, it must be FAST FAST FAST.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1315 This is the reason why so much of the code is duplicated.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1316

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1317 Similar considerations apply to bytebpos_to_charbpos_func(), although

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1318 less so because the function is not called so often.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1319

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1320 #### At some point this should use a more sophisticated method;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1321 see buffer.h. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1322

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1323 static int not_very_random_number;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1324

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1325 Bytebpos

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1326 charbpos_to_bytebpos_func (struct buffer *buf, Charbpos x)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1327 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1328 Charbpos bufmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1329 Charbpos bufmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1330 Bytebpos bytmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1331 Bytebpos bytmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1332 int size;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1333 int forward_p;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1334 Bytebpos retval;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1335 int diff_so_far;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1336 int add_to_cache = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1337

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1338 /* Check for some cached positions, for speed. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1339 if (x == BUF_PT (buf))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1340 return BI_BUF_PT (buf);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1341 if (x == BUF_ZV (buf))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1342 return BI_BUF_ZV (buf);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1343 if (x == BUF_BEGV (buf))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1344 return BI_BUF_BEGV (buf);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1345

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1346 bufmin = buf->text->mule_bufmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1347 bufmax = buf->text->mule_bufmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1348 bytmin = buf->text->mule_bytmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1349 bytmax = buf->text->mule_bytmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1350 size = (1 << buf->text->mule_shifter) + !!buf->text->mule_three_p;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1351

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1352 /* The basic idea here is that we shift the "known region" up or down

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1353 until it overlaps the specified position. We do this by moving

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1354 the upper bound of the known region up one character at a time,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1355 and moving the lower bound of the known region up as necessary

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1356 when the size of the character just seen changes.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1357

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1358 We optimize this, however, by first shifting the known region to

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1359 one of the cached points if it's close by. (We don't check BEG or

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1360 Z, even though they're cached; most of the time these will be the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1361 same as BEGV and ZV, and when they're not, they're not likely

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1362 to be used.) */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1363

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1364 if (x > bufmax)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1365 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1366 Charbpos diffmax = x - bufmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1367 Charbpos diffpt = x - BUF_PT (buf);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1368 Charbpos diffzv = BUF_ZV (buf) - x;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1369 /* #### This value could stand some more exploration. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1370 Charcount heuristic_hack = (bufmax - bufmin) >> 2;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1371

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1372 /* Check if the position is closer to PT or ZV than to the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1373 end of the known region. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1374

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1375 if (diffpt < 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1376 diffpt = -diffpt;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1377 if (diffzv < 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1378 diffzv = -diffzv;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1379

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1380 /* But also implement a heuristic that favors the known region

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1381 over PT or ZV. The reason for this is that switching to

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1382 PT or ZV will wipe out the knowledge in the known region,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1383 which might be annoying if the known region is large and

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1384 PT or ZV is not that much closer than the end of the known

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1385 region. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1386

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1387 diffzv += heuristic_hack;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1388 diffpt += heuristic_hack;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1389 if (diffpt < diffmax && diffpt <= diffzv)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1390 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1391 bufmax = bufmin = BUF_PT (buf);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1392 bytmax = bytmin = BI_BUF_PT (buf);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1393 /* We set the size to 1 even though it doesn't really

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1394 matter because the new known region contains no

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1395 characters. We do this because this is the most

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1396 likely size of the characters around the new known

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1397 region, and we avoid potential yuckiness that is

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1398 done when size == 3. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1399 size = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1400 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1401 if (diffzv < diffmax)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1402 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1403 bufmax = bufmin = BUF_ZV (buf);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1404 bytmax = bytmin = BI_BUF_ZV (buf);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1405 size = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1406 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1407 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1408 #ifdef ERROR_CHECK_CHARBPOS

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1409 else if (x >= bufmin)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1410 abort ();

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1411 #endif

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1412 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1413 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1414 Charbpos diffmin = bufmin - x;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1415 Charbpos diffpt = BUF_PT (buf) - x;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1416 Charbpos diffbegv = x - BUF_BEGV (buf);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1417 /* #### This value could stand some more exploration. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1418 Charcount heuristic_hack = (bufmax - bufmin) >> 2;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1419

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1420 if (diffpt < 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1421 diffpt = -diffpt;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1422 if (diffbegv < 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1423 diffbegv = -diffbegv;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1424

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1425 /* But also implement a heuristic that favors the known region --

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1426 see above. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1427

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1428 diffbegv += heuristic_hack;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1429 diffpt += heuristic_hack;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1430

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1431 if (diffpt < diffmin && diffpt <= diffbegv)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1432 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1433 bufmax = bufmin = BUF_PT (buf);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1434 bytmax = bytmin = BI_BUF_PT (buf);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1435 /* We set the size to 1 even though it doesn't really

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1436 matter because the new known region contains no

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1437 characters. We do this because this is the most

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1438 likely size of the characters around the new known

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1439 region, and we avoid potential yuckiness that is

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1440 done when size == 3. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1441 size = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1442 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1443 if (diffbegv < diffmin)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1444 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1445 bufmax = bufmin = BUF_BEGV (buf);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1446 bytmax = bytmin = BI_BUF_BEGV (buf);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1447 size = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1448 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1449 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1450

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1451 diff_so_far = x > bufmax ? x - bufmax : bufmin - x;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1452 if (diff_so_far > 50)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1453 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1454 /* If we have to move more than a certain amount, then look

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1455 into our cache. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1456 int minval = INT_MAX;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1457 int found = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1458 int i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1459

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1460 add_to_cache = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1461 /* I considered keeping the positions ordered. This would speed

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1462 up this loop, but updating the cache would take longer, so

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1463 it doesn't seem like it would really matter. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1464 for (i = 0; i < 16; i++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1465 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1466 int diff = buf->text->mule_charbpos_cache[i] - x;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1467

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1468 if (diff < 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1469 diff = -diff;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1470 if (diff < minval)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1471 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1472 minval = diff;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1473 found = i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1474 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1475 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1476

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1477 if (minval < diff_so_far)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1478 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1479 bufmax = bufmin = buf->text->mule_charbpos_cache[found];

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1480 bytmax = bytmin = buf->text->mule_bytebpos_cache[found];

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1481 size = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1482 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1483 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1484

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1485 /* It's conceivable that the caching above could lead to X being

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1486 the same as one of the range edges. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1487 if (x >= bufmax)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1488 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1489 Bytebpos newmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1490 Bytecount newsize;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1491

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1492 forward_p = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1493 while (x > bufmax)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1494 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1495 newmax = bytmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1496

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1497 INC_BYTEBPOS (buf, newmax);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1498 newsize = newmax - bytmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1499 if (newsize != size)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1500 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1501 bufmin = bufmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1502 bytmin = bytmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1503 size = newsize;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1504 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1505 bytmax = newmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1506 bufmax++;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1507 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1508 retval = bytmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1509

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1510 /* #### Should go past the found location to reduce the number

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1511 of times that this function is called */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1512 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1513 else /* x < bufmin */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1514 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1515 Bytebpos newmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1516 Bytecount newsize;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1517

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1518 forward_p = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1519 while (x < bufmin)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1520 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1521 newmin = bytmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1522

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1523 DEC_BYTEBPOS (buf, newmin);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1524 newsize = bytmin - newmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1525 if (newsize != size)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1526 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1527 bufmax = bufmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1528 bytmax = bytmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1529 size = newsize;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1530 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1531 bytmin = newmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1532 bufmin--;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1533 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1534 retval = bytmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1535

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1536 /* #### Should go past the found location to reduce the number

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1537 of times that this function is called

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1538 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1539 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1540

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1541 /* If size is three, than we have to max sure that the range we

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1542 discovered isn't too large, because we use a fixed-length

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1543 table to divide by 3. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1544

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1545 if (size == 3)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1546 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1547 int gap = bytmax - bytmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1548 buf->text->mule_three_p = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1549 buf->text->mule_shifter = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1550

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1551 if (gap > MAX_BYTEBPOS_GAP_SIZE_3)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1552 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1553 if (forward_p)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1554 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1555 bytmin = bytmax - MAX_BYTEBPOS_GAP_SIZE_3;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1556 bufmin = bufmax - MAX_CHARBPOS_GAP_SIZE_3;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1557 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1558 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1559 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1560 bytmax = bytmin + MAX_BYTEBPOS_GAP_SIZE_3;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1561 bufmax = bufmin + MAX_CHARBPOS_GAP_SIZE_3;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1562 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1563 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1564 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1565 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1566 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1567 buf->text->mule_three_p = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1568 if (size == 4)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1569 buf->text->mule_shifter = 2;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1570 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1571 buf->text->mule_shifter = size - 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1572 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1573

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1574 buf->text->mule_bufmin = bufmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1575 buf->text->mule_bufmax = bufmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1576 buf->text->mule_bytmin = bytmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1577 buf->text->mule_bytmax = bytmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1578 update_entirely_ascii_p_flag (buf);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1579

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1580 if (add_to_cache)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1581 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1582 int replace_loc;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1583

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1584 /* We throw away a "random" cached value and replace it with

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1585 the new value. It doesn't actually have to be very random

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1586 at all, just evenly distributed.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1587

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1588 #### It would be better to use a least-recently-used algorithm

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1589 or something that tries to space things out, but I'm not sure

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1590 it's worth it to go to the trouble of maintaining that. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1591 not_very_random_number += 621;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1592 replace_loc = not_very_random_number & 15;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1593 buf->text->mule_charbpos_cache[replace_loc] = x;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1594 buf->text->mule_bytebpos_cache[replace_loc] = retval;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1595 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1596

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1597 return retval;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1598 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1599

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1600 /* The logic in this function is almost identical to the logic in

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1601 the previous function. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1602

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1603 Charbpos

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1604 bytebpos_to_charbpos_func (struct buffer *buf, Bytebpos x)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1605 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1606 Charbpos bufmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1607 Charbpos bufmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1608 Bytebpos bytmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1609 Bytebpos bytmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1610 int size;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1611 int forward_p;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1612 Charbpos retval;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1613 int diff_so_far;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1614 int add_to_cache = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1615

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1616 /* Check for some cached positions, for speed. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1617 if (x == BI_BUF_PT (buf))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1618 return BUF_PT (buf);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1619 if (x == BI_BUF_ZV (buf))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1620 return BUF_ZV (buf);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1621 if (x == BI_BUF_BEGV (buf))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1622 return BUF_BEGV (buf);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1623

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1624 bufmin = buf->text->mule_bufmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1625 bufmax = buf->text->mule_bufmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1626 bytmin = buf->text->mule_bytmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1627 bytmax = buf->text->mule_bytmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1628 size = (1 << buf->text->mule_shifter) + !!buf->text->mule_three_p;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1629

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1630 /* The basic idea here is that we shift the "known region" up or down

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1631 until it overlaps the specified position. We do this by moving

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1632 the upper bound of the known region up one character at a time,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1633 and moving the lower bound of the known region up as necessary

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1634 when the size of the character just seen changes.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1635

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1636 We optimize this, however, by first shifting the known region to

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1637 one of the cached points if it's close by. (We don't check BI_BEG or

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1638 BI_Z, even though they're cached; most of the time these will be the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1639 same as BI_BEGV and BI_ZV, and when they're not, they're not likely

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1640 to be used.) */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1641

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1642 if (x > bytmax)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1643 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1644 Bytebpos diffmax = x - bytmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1645 Bytebpos diffpt = x - BI_BUF_PT (buf);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1646 Bytebpos diffzv = BI_BUF_ZV (buf) - x;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1647 /* #### This value could stand some more exploration. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1648 Bytecount heuristic_hack = (bytmax - bytmin) >> 2;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1649

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1650 /* Check if the position is closer to PT or ZV than to the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1651 end of the known region. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1652

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1653 if (diffpt < 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1654 diffpt = -diffpt;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1655 if (diffzv < 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1656 diffzv = -diffzv;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1657

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1658 /* But also implement a heuristic that favors the known region

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1659 over BI_PT or BI_ZV. The reason for this is that switching to

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1660 BI_PT or BI_ZV will wipe out the knowledge in the known region,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1661 which might be annoying if the known region is large and

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1662 BI_PT or BI_ZV is not that much closer than the end of the known

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1663 region. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1664

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1665 diffzv += heuristic_hack;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1666 diffpt += heuristic_hack;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1667 if (diffpt < diffmax && diffpt <= diffzv)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1668 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1669 bufmax = bufmin = BUF_PT (buf);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1670 bytmax = bytmin = BI_BUF_PT (buf);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1671 /* We set the size to 1 even though it doesn't really

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1672 matter because the new known region contains no

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1673 characters. We do this because this is the most

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1674 likely size of the characters around the new known

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1675 region, and we avoid potential yuckiness that is

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1676 done when size == 3. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1677 size = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1678 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1679 if (diffzv < diffmax)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1680 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1681 bufmax = bufmin = BUF_ZV (buf);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1682 bytmax = bytmin = BI_BUF_ZV (buf);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1683 size = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1684 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1685 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1686 #ifdef ERROR_CHECK_CHARBPOS

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1687 else if (x >= bytmin)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1688 abort ();

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1689 #endif

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1690 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1691 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1692 Bytebpos diffmin = bytmin - x;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1693 Bytebpos diffpt = BI_BUF_PT (buf) - x;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1694 Bytebpos diffbegv = x - BI_BUF_BEGV (buf);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1695 /* #### This value could stand some more exploration. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1696 Bytecount heuristic_hack = (bytmax - bytmin) >> 2;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1697

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1698 if (diffpt < 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1699 diffpt = -diffpt;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1700 if (diffbegv < 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1701 diffbegv = -diffbegv;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1702

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1703 /* But also implement a heuristic that favors the known region --

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1704 see above. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1705

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1706 diffbegv += heuristic_hack;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1707 diffpt += heuristic_hack;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1708

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1709 if (diffpt < diffmin && diffpt <= diffbegv)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1710 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1711 bufmax = bufmin = BUF_PT (buf);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1712 bytmax = bytmin = BI_BUF_PT (buf);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1713 /* We set the size to 1 even though it doesn't really

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1714 matter because the new known region contains no

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1715 characters. We do this because this is the most

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1716 likely size of the characters around the new known

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1717 region, and we avoid potential yuckiness that is

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1718 done when size == 3. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1719 size = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1720 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1721 if (diffbegv < diffmin)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1722 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1723 bufmax = bufmin = BUF_BEGV (buf);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1724 bytmax = bytmin = BI_BUF_BEGV (buf);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1725 size = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1726 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1727 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1728

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1729 diff_so_far = x > bytmax ? x - bytmax : bytmin - x;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1730 if (diff_so_far > 50)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1731 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1732 /* If we have to move more than a certain amount, then look

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1733 into our cache. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1734 int minval = INT_MAX;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1735 int found = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1736 int i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1737

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1738 add_to_cache = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1739 /* I considered keeping the positions ordered. This would speed

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1740 up this loop, but updating the cache would take longer, so

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1741 it doesn't seem like it would really matter. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1742 for (i = 0; i < 16; i++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1743 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1744 int diff = buf->text->mule_bytebpos_cache[i] - x;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1745

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1746 if (diff < 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1747 diff = -diff;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1748 if (diff < minval)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1749 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1750 minval = diff;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1751 found = i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1752 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1753 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1754

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1755 if (minval < diff_so_far)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1756 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1757 bufmax = bufmin = buf->text->mule_charbpos_cache[found];

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1758 bytmax = bytmin = buf->text->mule_bytebpos_cache[found];

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1759 size = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1760 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1761 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1762

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1763 /* It's conceivable that the caching above could lead to X being

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1764 the same as one of the range edges. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1765 if (x >= bytmax)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1766 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1767 Bytebpos newmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1768 Bytecount newsize;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1769

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1770 forward_p = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1771 while (x > bytmax)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1772 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1773 newmax = bytmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1774

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1775 INC_BYTEBPOS (buf, newmax);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1776 newsize = newmax - bytmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1777 if (newsize != size)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1778 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1779 bufmin = bufmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1780 bytmin = bytmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1781 size = newsize;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1782 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1783 bytmax = newmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1784 bufmax++;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1785 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1786 retval = bufmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1787

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1788 /* #### Should go past the found location to reduce the number

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1789 of times that this function is called */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1790 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1791 else /* x <= bytmin */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1792 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1793 Bytebpos newmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1794 Bytecount newsize;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1795

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1796 forward_p = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1797 while (x < bytmin)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1798 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1799 newmin = bytmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1800

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1801 DEC_BYTEBPOS (buf, newmin);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1802 newsize = bytmin - newmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1803 if (newsize != size)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1804 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1805 bufmax = bufmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1806 bytmax = bytmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1807 size = newsize;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1808 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1809 bytmin = newmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1810 bufmin--;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1811 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1812 retval = bufmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1813

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1814 /* #### Should go past the found location to reduce the number

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1815 of times that this function is called

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1816 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1817 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1818

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1819 /* If size is three, than we have to max sure that the range we

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1820 discovered isn't too large, because we use a fixed-length

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1821 table to divide by 3. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1822

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1823 if (size == 3)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1824 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1825 int gap = bytmax - bytmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1826 buf->text->mule_three_p = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1827 buf->text->mule_shifter = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1828

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1829 if (gap > MAX_BYTEBPOS_GAP_SIZE_3)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1830 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1831 if (forward_p)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1832 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1833 bytmin = bytmax - MAX_BYTEBPOS_GAP_SIZE_3;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1834 bufmin = bufmax - MAX_CHARBPOS_GAP_SIZE_3;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1835 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1836 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1837 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1838 bytmax = bytmin + MAX_BYTEBPOS_GAP_SIZE_3;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1839 bufmax = bufmin + MAX_CHARBPOS_GAP_SIZE_3;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1840 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1841 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1842 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1843 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1844 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1845 buf->text->mule_three_p = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1846 if (size == 4)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1847 buf->text->mule_shifter = 2;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1848 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1849 buf->text->mule_shifter = size - 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1850 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1851

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1852 buf->text->mule_bufmin = bufmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1853 buf->text->mule_bufmax = bufmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1854 buf->text->mule_bytmin = bytmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1855 buf->text->mule_bytmax = bytmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1856 update_entirely_ascii_p_flag (buf);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1857

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1858 if (add_to_cache)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1859 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1860 int replace_loc;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1861

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1862 /* We throw away a "random" cached value and replace it with

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1863 the new value. It doesn't actually have to be very random

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1864 at all, just evenly distributed.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1865

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1866 #### It would be better to use a least-recently-used algorithm

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1867 or something that tries to space things out, but I'm not sure

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1868 it's worth it to go to the trouble of maintaining that. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1869 not_very_random_number += 621;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1870 replace_loc = not_very_random_number & 15;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1871 buf->text->mule_charbpos_cache[replace_loc] = retval;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1872 buf->text->mule_bytebpos_cache[replace_loc] = x;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1873 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1874

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1875 return retval;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1876 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1877

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1878 /* Text of length BYTELENGTH and CHARLENGTH (in different units)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1879 was inserted at charbpos START. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1880

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1881 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1882 buffer_mule_signal_inserted_region (struct buffer *buf, Charbpos start,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1883 Bytecount bytelength,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1884 Charcount charlength)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1885 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1886 int size = (1 << buf->text->mule_shifter) + !!buf->text->mule_three_p;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1887 int i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1888

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1889 /* Adjust the cache of known positions. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1890 for (i = 0; i < 16; i++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1891 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1892

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1893 if (buf->text->mule_charbpos_cache[i] > start)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1894 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1895 buf->text->mule_charbpos_cache[i] += charlength;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1896 buf->text->mule_bytebpos_cache[i] += bytelength;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1897 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1898 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1899

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1900 if (start >= buf->text->mule_bufmax)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1901 goto done;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1902

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1903 /* The insertion is either before the known region, in which case

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1904 it shoves it forward; or within the known region, in which case

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1905 it shoves the end forward. (But it may make the known region

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1906 inconsistent, so we may have to shorten it.) */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1907

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1908 if (start <= buf->text->mule_bufmin)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1909 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1910 buf->text->mule_bufmin += charlength;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1911 buf->text->mule_bufmax += charlength;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1912 buf->text->mule_bytmin += bytelength;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1913 buf->text->mule_bytmax += bytelength;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1914 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1915 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1916 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1917 Charbpos end = start + charlength;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1918 /* the insertion point divides the known region in two.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1919 Keep the longer half, at least, and expand into the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1920 inserted chunk as much as possible. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1921

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1922 if (start - buf->text->mule_bufmin > buf->text->mule_bufmax - start)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1923 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1924 Bytebpos bytestart = (buf->text->mule_bytmin

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1925 + size * (start - buf->text->mule_bufmin));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1926 Bytebpos bytenew;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1927

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1928 while (start < end)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1929 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1930 bytenew = bytestart;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1931 INC_BYTEBPOS (buf, bytenew);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1932 if (bytenew - bytestart != size)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1933 break;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1934 start++;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1935 bytestart = bytenew;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1936 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1937 if (start != end)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1938 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1939 buf->text->mule_bufmax = start;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1940 buf->text->mule_bytmax = bytestart;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1941 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1942 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1943 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1944 buf->text->mule_bufmax += charlength;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1945 buf->text->mule_bytmax += bytelength;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1946 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1947 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1948 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1949 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1950 Bytebpos byteend = (buf->text->mule_bytmin

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1951 + size * (start - buf->text->mule_bufmin)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1952 + bytelength);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1953 Bytebpos bytenew;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1954

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1955 buf->text->mule_bufmax += charlength;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1956 buf->text->mule_bytmax += bytelength;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1957

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1958 while (end > start)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1959 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1960 bytenew = byteend;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1961 DEC_BYTEBPOS (buf, bytenew);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1962 if (byteend - bytenew != size)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1963 break;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1964 end--;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1965 byteend = bytenew;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1966 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1967 if (start != end)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1968 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1969 buf->text->mule_bufmin = end;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1970 buf->text->mule_bytmin = byteend;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1971 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1972 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1973 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1974 done:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1975 update_entirely_ascii_p_flag (buf);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1976 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1977

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1978 /* Text from START to END (equivalent in Bytebposs: from BI_START to

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1979 BI_END) was deleted. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1980

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1981 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1982 buffer_mule_signal_deleted_region (struct buffer *buf, Charbpos start,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1983 Charbpos end, Bytebpos bi_start,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1984 Bytebpos bi_end)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1985 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1986 int i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1987

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1988 /* Adjust the cache of known positions. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1989 for (i = 0; i < 16; i++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1990 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1991 /* After the end; gets shoved backward */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1992 if (buf->text->mule_charbpos_cache[i] > end)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1993 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1994 buf->text->mule_charbpos_cache[i] -= end - start;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1995 buf->text->mule_bytebpos_cache[i] -= bi_end - bi_start;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1996 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1997 /* In the range; moves to start of range */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1998 else if (buf->text->mule_charbpos_cache[i] > start)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1999 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2000 buf->text->mule_charbpos_cache[i] = start;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2001 buf->text->mule_bytebpos_cache[i] = bi_start;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2002 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2003 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2004

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2005 /* We don't care about any text after the end of the known region. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2006

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2007 end = min (end, buf->text->mule_bufmax);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2008 bi_end = min (bi_end, buf->text->mule_bytmax);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2009 if (start >= end)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2010 goto done;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2011

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2012 /* The end of the known region offsets by the total amount of deletion,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2013 since it's all before it. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2014

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2015 buf->text->mule_bufmax -= end - start;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2016 buf->text->mule_bytmax -= bi_end - bi_start;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2017

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2018 /* Now we don't care about any text after the start of the known region. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2019

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2020 end = min (end, buf->text->mule_bufmin);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2021 bi_end = min (bi_end, buf->text->mule_bytmin);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2022 if (start < end)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2023 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2024 buf->text->mule_bufmin -= end - start;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2025 buf->text->mule_bytmin -= bi_end - bi_start;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2026 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2027

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2028 done:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2029 update_entirely_ascii_p_flag (buf);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2030 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2031

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2032 #endif /* MULE */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2033

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2034 #ifdef ERROR_CHECK_CHARBPOS

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2035

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2036 Bytebpos

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2037 charbpos_to_bytebpos (struct buffer *buf, Charbpos x)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2038 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2039 Bytebpos retval = real_charbpos_to_bytebpos (buf, x);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2040 ASSERT_VALID_BYTEBPOS_UNSAFE (buf, retval);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2041 return retval;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2042 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2043

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2044 Charbpos

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2045 bytebpos_to_charbpos (struct buffer *buf, Bytebpos x)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2046 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2047 ASSERT_VALID_BYTEBPOS_UNSAFE (buf, x);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2048 return real_bytebpos_to_charbpos (buf, x);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2049 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2050

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2051 #endif /* ERROR_CHECK_CHARBPOS */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2052

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2053

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2054 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2055 /* verifying buffer and string positions */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2056 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2057

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2058 /* Functions below are tagged with either _byte or _char indicating

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2059 whether they return byte or character positions. For a buffer,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2060 a character position is a "Charbpos" and a byte position is a "Bytebpos".

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2061 For strings, these are sometimes typed using "Charcount" and

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2062 "Bytecount". */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2063

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2064 /* Flags for the functions below are:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2065

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2066 GB_ALLOW_PAST_ACCESSIBLE

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2067

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2068 Allow positions to range over the entire buffer (BUF_BEG to BUF_Z),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2069 rather than just the accessible portion (BUF_BEGV to BUF_ZV).

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2070 For strings, this flag has no effect.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2071

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2072 GB_COERCE_RANGE

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2073

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2074 If the position is outside the allowable range, return the lower

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2075 or upper bound of the range, whichever is closer to the specified

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2076 position.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2077

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2078 GB_NO_ERROR_IF_BAD

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2079

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2080 If the position is outside the allowable range, return -1.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2081

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2082 GB_NEGATIVE_FROM_END

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2083

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2084 If a value is negative, treat it as an offset from the end.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2085 Only applies to strings.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2086

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2087 The following additional flags apply only to the functions

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2088 that return ranges:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2089

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2090 GB_ALLOW_NIL

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2091

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2092 Either or both positions can be nil. If FROM is nil,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2093 FROM_OUT will contain the lower bound of the allowed range.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2094 If TO is nil, TO_OUT will contain the upper bound of the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2095 allowed range.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2096

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2097 GB_CHECK_ORDER

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2098

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2099 FROM must contain the lower bound and TO the upper bound

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2100 of the range. If the positions are reversed, an error is

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2101 signalled.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2102

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2103 The following is a combination flag:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2104

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2105 GB_HISTORICAL_STRING_BEHAVIOR

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2106

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2107 Equivalent to (GB_NEGATIVE_FROM_END | GB_ALLOW_NIL).

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2108 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2109

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2110 /* Return a buffer position stored in a Lisp_Object. Full

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2111 error-checking is done on the position. Flags can be specified to

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2112 control the behavior of out-of-range values. The default behavior

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2113 is to require that the position is within the accessible part of

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2114 the buffer (BEGV and ZV), and to signal an error if the position is

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2115 out of range.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2116

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2117 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2118

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2119 Charbpos

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2120 get_buffer_pos_char (struct buffer *b, Lisp_Object pos, unsigned int flags)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2121 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2122 /* Does not GC */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2123 Charbpos ind;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2124 Charbpos min_allowed, max_allowed;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2125

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2126 CHECK_INT_COERCE_MARKER (pos);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2127 ind = XINT (pos);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2128 min_allowed = flags & GB_ALLOW_PAST_ACCESSIBLE ? BUF_BEG (b) : BUF_BEGV (b);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2129 max_allowed = flags & GB_ALLOW_PAST_ACCESSIBLE ? BUF_Z (b) : BUF_ZV (b);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2130

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2131 if (ind < min_allowed || ind > max_allowed)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2132 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2133 if (flags & GB_COERCE_RANGE)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2134 ind = ind < min_allowed ? min_allowed : max_allowed;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2135 else if (flags & GB_NO_ERROR_IF_BAD)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2136 ind = -1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2137 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2138 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2139 Lisp_Object buffer;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2140 XSETBUFFER (buffer, b);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2141 args_out_of_range (buffer, pos);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2142 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2143 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2144

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2145 return ind;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2146 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2147

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2148 Bytebpos

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2149 get_buffer_pos_byte (struct buffer *b, Lisp_Object pos, unsigned int flags)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2150 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2151 Charbpos bpos = get_buffer_pos_char (b, pos, flags);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2152 if (bpos < 0) /* could happen with GB_NO_ERROR_IF_BAD */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2153 return -1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2154 return charbpos_to_bytebpos (b, bpos);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2155 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2156

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2157 /* Return a pair of buffer positions representing a range of text,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2158 taken from a pair of Lisp_Objects. Full error-checking is

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2159 done on the positions. Flags can be specified to control the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2160 behavior of out-of-range values. The default behavior is to

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2161 allow the range bounds to be specified in either order

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2162 (however, FROM_OUT will always be the lower bound of the range

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2163 and TO_OUT the upper bound),to require that the positions

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2164 are within the accessible part of the buffer (BEGV and ZV),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2165 and to signal an error if the positions are out of range.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2166 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2167

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2168 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2169 get_buffer_range_char (struct buffer *b, Lisp_Object from, Lisp_Object to,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2170 Charbpos *from_out, Charbpos *to_out, unsigned int flags)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2171 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2172 /* Does not GC */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2173 Charbpos min_allowed, max_allowed;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2174

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2175 min_allowed = (flags & GB_ALLOW_PAST_ACCESSIBLE) ?

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2176 BUF_BEG (b) : BUF_BEGV (b);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2177 max_allowed = (flags & GB_ALLOW_PAST_ACCESSIBLE) ?

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2178 BUF_Z (b) : BUF_ZV (b);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2179

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2180 if (NILP (from) && (flags & GB_ALLOW_NIL))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2181 *from_out = min_allowed;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2182 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2183 *from_out = get_buffer_pos_char (b, from, flags | GB_NO_ERROR_IF_BAD);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2184

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2185 if (NILP (to) && (flags & GB_ALLOW_NIL))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2186 *to_out = max_allowed;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2187 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2188 *to_out = get_buffer_pos_char (b, to, flags | GB_NO_ERROR_IF_BAD);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2189

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2190 if ((*from_out < 0 || *to_out < 0) && !(flags & GB_NO_ERROR_IF_BAD))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2191 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2192 Lisp_Object buffer;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2193 XSETBUFFER (buffer, b);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2194 args_out_of_range_3 (buffer, from, to);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2195 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2196

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2197 if (*from_out >= 0 && *to_out >= 0 && *from_out > *to_out)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2198 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2199 if (flags & GB_CHECK_ORDER)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2200 invalid_argument_2 ("start greater than end", from, to);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2201 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2202 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2203 Charbpos temp = *from_out;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2204 *from_out = *to_out;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2205 *to_out = temp;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2206 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2207 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2208 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2209

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2210 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2211 get_buffer_range_byte (struct buffer *b, Lisp_Object from, Lisp_Object to,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2212 Bytebpos *from_out, Bytebpos *to_out, unsigned int flags)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2213 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2214 Charbpos s, e;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2215

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2216 get_buffer_range_char (b, from, to, &s, &e, flags);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2217 if (s >= 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2218 *from_out = charbpos_to_bytebpos (b, s);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2219 else /* could happen with GB_NO_ERROR_IF_BAD */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2220 *from_out = -1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2221 if (e >= 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2222 *to_out = charbpos_to_bytebpos (b, e);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2223 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2224 *to_out = -1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2225 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2226

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2227 static Charcount

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2228 get_string_pos_char_1 (Lisp_Object string, Lisp_Object pos, unsigned int flags,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2229 Charcount known_length)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2230 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2231 Charcount ccpos;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2232 Charcount min_allowed = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2233 Charcount max_allowed = known_length;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2234

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2235 /* Computation of KNOWN_LENGTH is potentially expensive so we pass

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2236 it in. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2237 CHECK_INT (pos);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2238 ccpos = XINT (pos);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2239 if (ccpos < 0 && flags & GB_NEGATIVE_FROM_END)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2240 ccpos += max_allowed;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2241

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2242 if (ccpos < min_allowed || ccpos > max_allowed)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2243 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2244 if (flags & GB_COERCE_RANGE)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2245 ccpos = ccpos < min_allowed ? min_allowed : max_allowed;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2246 else if (flags & GB_NO_ERROR_IF_BAD)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2247 ccpos = -1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2248 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2249 args_out_of_range (string, pos);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2250 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2251

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2252 return ccpos;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2253 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2254

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2255 Charcount

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2256 get_string_pos_char (Lisp_Object string, Lisp_Object pos, unsigned int flags)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2257 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2258 return get_string_pos_char_1 (string, pos, flags,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2259 XSTRING_CHAR_LENGTH (string));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2260 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2261

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2262 Bytecount

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2263 get_string_pos_byte (Lisp_Object string, Lisp_Object pos, unsigned int flags)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2264 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2265 Charcount ccpos = get_string_pos_char (string, pos, flags);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2266 if (ccpos < 0) /* could happen with GB_NO_ERROR_IF_BAD */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2267 return -1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2268 return XSTRING_INDEX_CHAR_TO_BYTE (string, ccpos);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2269 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2270

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2271 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2272 get_string_range_char (Lisp_Object string, Lisp_Object from, Lisp_Object to,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2273 Charcount *from_out, Charcount *to_out,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2274 unsigned int flags)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2275 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2276 Charcount min_allowed = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2277 Charcount max_allowed = XSTRING_CHAR_LENGTH (string);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2278

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2279 if (NILP (from) && (flags & GB_ALLOW_NIL))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2280 *from_out = min_allowed;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2281 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2282 *from_out = get_string_pos_char_1 (string, from,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2283 flags | GB_NO_ERROR_IF_BAD,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2284 max_allowed);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2285

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2286 if (NILP (to) && (flags & GB_ALLOW_NIL))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2287 *to_out = max_allowed;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2288 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2289 *to_out = get_string_pos_char_1 (string, to,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2290 flags | GB_NO_ERROR_IF_BAD,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2291 max_allowed);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2292

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2293 if ((*from_out < 0 || *to_out < 0) && !(flags & GB_NO_ERROR_IF_BAD))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2294 args_out_of_range_3 (string, from, to);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2295

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2296 if (*from_out >= 0 && *to_out >= 0 && *from_out > *to_out)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2297 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2298 if (flags & GB_CHECK_ORDER)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2299 invalid_argument_2 ("start greater than end", from, to);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2300 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2301 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2302 Charbpos temp = *from_out;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2303 *from_out = *to_out;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2304 *to_out = temp;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2305 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2306 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2307 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2308

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2309 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2310 get_string_range_byte (Lisp_Object string, Lisp_Object from, Lisp_Object to,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2311 Bytecount *from_out, Bytecount *to_out,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2312 unsigned int flags)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2313 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2314 Charcount s, e;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2315

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2316 get_string_range_char (string, from, to, &s, &e, flags);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2317 if (s >= 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2318 *from_out = XSTRING_INDEX_CHAR_TO_BYTE (string, s);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2319 else /* could happen with GB_NO_ERROR_IF_BAD */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2320 *from_out = -1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2321 if (e >= 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2322 *to_out = XSTRING_INDEX_CHAR_TO_BYTE (string, e);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2323 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2324 *to_out = -1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2325

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2326 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2327

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2328 Charbpos

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2329 get_buffer_or_string_pos_char (Lisp_Object object, Lisp_Object pos,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2330 unsigned int flags)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2331 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2332 return STRINGP (object) ?

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2333 get_string_pos_char (object, pos, flags) :

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2334 get_buffer_pos_char (XBUFFER (object), pos, flags);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2335 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2336

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2337 Bytebpos

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2338 get_buffer_or_string_pos_byte (Lisp_Object object, Lisp_Object pos,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2339 unsigned int flags)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2340 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2341 return STRINGP (object) ?

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2342 get_string_pos_byte (object, pos, flags) :

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2343 get_buffer_pos_byte (XBUFFER (object), pos, flags);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2344 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2345

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2346 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2347 get_buffer_or_string_range_char (Lisp_Object object, Lisp_Object from,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2348 Lisp_Object to, Charbpos *from_out,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2349 Charbpos *to_out, unsigned int flags)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2350 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2351 if (STRINGP (object))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2352 get_string_range_char (object, from, to, from_out, to_out, flags);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2353 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2354 get_buffer_range_char (XBUFFER (object), from, to, from_out, to_out, flags);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2355 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2356

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2357 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2358 get_buffer_or_string_range_byte (Lisp_Object object, Lisp_Object from,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2359 Lisp_Object to, Bytebpos *from_out,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2360 Bytebpos *to_out, unsigned int flags)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2361 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2362 if (STRINGP (object))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2363 get_string_range_byte (object, from, to, from_out, to_out, flags);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2364 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2365 get_buffer_range_byte (XBUFFER (object), from, to, from_out, to_out, flags);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2366 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2367

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2368 Charbpos

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2369 buffer_or_string_accessible_begin_char (Lisp_Object object)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2370 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2371 return STRINGP (object) ? 0 : BUF_BEGV (XBUFFER (object));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2372 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2373

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2374 Charbpos

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2375 buffer_or_string_accessible_end_char (Lisp_Object object)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2376 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2377 return STRINGP (object) ?

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2378 XSTRING_CHAR_LENGTH (object) : BUF_ZV (XBUFFER (object));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2379 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2380

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2381 Bytebpos

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2382 buffer_or_string_accessible_begin_byte (Lisp_Object object)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2383 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2384 return STRINGP (object) ? 0 : BI_BUF_BEGV (XBUFFER (object));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2385 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2386

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2387 Bytebpos

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2388 buffer_or_string_accessible_end_byte (Lisp_Object object)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2389 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2390 return STRINGP (object) ?

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2391 XSTRING_LENGTH (object) : BI_BUF_ZV (XBUFFER (object));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2392 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2393

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2394 Charbpos

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2395 buffer_or_string_absolute_begin_char (Lisp_Object object)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2396 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2397 return STRINGP (object) ? 0 : BUF_BEG (XBUFFER (object));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2398 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2399

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2400 Charbpos

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2401 buffer_or_string_absolute_end_char (Lisp_Object object)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2402 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2403 return STRINGP (object) ?

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2404 XSTRING_CHAR_LENGTH (object) : BUF_Z (XBUFFER (object));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2405 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2406

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2407 Bytebpos

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2408 buffer_or_string_absolute_begin_byte (Lisp_Object object)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2409 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2410 return STRINGP (object) ? 0 : BI_BUF_BEG (XBUFFER (object));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2411 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2412

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2413 Bytebpos

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2414 buffer_or_string_absolute_end_byte (Lisp_Object object)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2415 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2416 return STRINGP (object) ?

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2417 XSTRING_LENGTH (object) : BI_BUF_Z (XBUFFER (object));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2418 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2419

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2420

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2421 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2422 /* Implement TO_EXTERNAL_FORMAT, TO_INTERNAL_FORMAT */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2423 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2424

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2425 typedef struct

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2426 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2427 Dynarr_declare (Intbyte_dynarr *);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2428 } Intbyte_dynarr_dynarr;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2429

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2430 typedef struct

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2431 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2432 Dynarr_declare (Extbyte_dynarr *);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2433 } Extbyte_dynarr_dynarr;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2434

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2435 static Extbyte_dynarr_dynarr *conversion_out_dynarr_list;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2436 static Intbyte_dynarr_dynarr *conversion_in_dynarr_list;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2437

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2438 static int dfc_convert_to_external_format_in_use;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2439 static int dfc_convert_to_internal_format_in_use;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2440

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2441 static Lisp_Object

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2442 dfc_convert_to_external_format_reset_in_use (Lisp_Object value)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2443 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2444 dfc_convert_to_external_format_in_use = XINT (value);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2445 return Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2446 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2447

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2448 static Lisp_Object

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2449 dfc_convert_to_internal_format_reset_in_use (Lisp_Object value)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2450 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2451 dfc_convert_to_internal_format_in_use = XINT (value);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2452 return Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2453 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2454

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2455 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2456 dfc_convert_to_external_format (dfc_conversion_type source_type,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2457 dfc_conversion_data *source,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2458 Lisp_Object coding_system,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2459 dfc_conversion_type sink_type,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2460 dfc_conversion_data *sink)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2461 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2462 /* It's guaranteed that many callers are not prepared for GC here,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2463 esp. given that this code conversion occurs in many very hidden

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2464 places. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2465 int count = begin_gc_forbidden ();

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2466 Extbyte_dynarr *conversion_out_dynarr;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2467

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2468 type_checking_assert

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2469 (((source_type == DFC_TYPE_DATA) ||

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2470 (source_type == DFC_TYPE_LISP_LSTREAM && LSTREAMP (source->lisp_object)) ||

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2471 (source_type == DFC_TYPE_LISP_STRING && STRINGP (source->lisp_object)))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2472 &&

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2473 ((sink_type == DFC_TYPE_DATA) ||

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2474 (sink_type == DFC_TYPE_LISP_LSTREAM && LSTREAMP (source->lisp_object))));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2475

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2476 record_unwind_protect (dfc_convert_to_external_format_reset_in_use,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2477 make_int (dfc_convert_to_external_format_in_use));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2478 if (Dynarr_length (conversion_out_dynarr_list) <=

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2479 dfc_convert_to_external_format_in_use)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2480 Dynarr_add (conversion_out_dynarr_list, Dynarr_new (Extbyte));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2481 conversion_out_dynarr = Dynarr_at (conversion_out_dynarr_list,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2482 dfc_convert_to_external_format_in_use);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2483 dfc_convert_to_external_format_in_use++;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2484 Dynarr_reset (conversion_out_dynarr);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2485

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2486 coding_system = get_coding_system_for_text_file (coding_system, 0);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2487

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2488 /* Here we optimize in the case where the coding system does no

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2489 conversion. However, we don't want to optimize in case the source

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2490 or sink is an lstream, since writing to an lstream can cause a

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2491 garbage collection, and this could be problematic if the source

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2492 is a lisp string. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2493 if (source_type != DFC_TYPE_LISP_LSTREAM &&

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2494 sink_type != DFC_TYPE_LISP_LSTREAM &&

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2495 coding_system_is_binary (coding_system))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2496 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2497 const Intbyte *ptr;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2498 Bytecount len;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2499

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2500 if (source_type == DFC_TYPE_LISP_STRING)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2501 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2502 ptr = XSTRING_DATA (source->lisp_object);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2503 len = XSTRING_LENGTH (source->lisp_object);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2504 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2505 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2506 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2507 ptr = (Intbyte *) source->data.ptr;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2508 len = source->data.len;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2509 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2510

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2511 #ifdef MULE

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2512 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2513 const Intbyte *end;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2514 for (end = ptr + len; ptr < end;)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2515 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2516 Intbyte c =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2517 (BYTE_ASCII_P (*ptr)) ? *ptr :

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2518 (*ptr == LEADING_BYTE_CONTROL_1) ? (*(ptr+1) - 0x20) :

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2519 (*ptr == LEADING_BYTE_LATIN_ISO8859_1) ? (*(ptr+1)) :

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2520 '~';

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2521

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2522 Dynarr_add (conversion_out_dynarr, (Extbyte) c);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2523 INC_CHARPTR (ptr);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2524 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2525 charbpos_checking_assert (ptr == end);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2526 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2527 #else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2528 Dynarr_add_many (conversion_out_dynarr, ptr, len);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2529 #endif

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2530

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2531 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2532 #ifdef HAVE_WIN32_CODING_SYSTEMS

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2533 /* Optimize the common case involving Unicode where only ASCII is involved */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2534 else if (source_type != DFC_TYPE_LISP_LSTREAM &&

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2535 sink_type != DFC_TYPE_LISP_LSTREAM &&

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2536 dfc_coding_system_is_unicode (coding_system))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2537 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2538 const Intbyte *ptr, *p;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2539 Bytecount len;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2540 const Intbyte *end;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2541

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2542 if (source_type == DFC_TYPE_LISP_STRING)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2543 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2544 ptr = XSTRING_DATA (source->lisp_object);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2545 len = XSTRING_LENGTH (source->lisp_object);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2546 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2547 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2548 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2549 ptr = (Intbyte *) source->data.ptr;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2550 len = source->data.len;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2551 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2552 end = ptr + len;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2553

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2554 for (p = ptr; p < end; p++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2555 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2556 if (!BYTE_ASCII_P (*p))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2557 goto the_hard_way;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2558 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2559

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2560 for (p = ptr; p < end; p++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2561 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2562 Dynarr_add (conversion_out_dynarr, (Extbyte) (*p));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2563 Dynarr_add (conversion_out_dynarr, (Extbyte) '\0');

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2564 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2565 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2566 #endif /* HAVE_WIN32_CODING_SYSTEMS */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2567 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2568 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2569 Lisp_Object streams_to_delete[3];

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2570 int delete_count;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2571 Lisp_Object instream, outstream;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2572 Lstream *reader, *writer;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2573 struct gcpro gcpro1, gcpro2;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2574

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2575 #ifdef HAVE_WIN32_CODING_SYSTEMS

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2576 the_hard_way:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2577 #endif /* HAVE_WIN32_CODING_SYSTEMS */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2578 delete_count = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2579 if (source_type == DFC_TYPE_LISP_LSTREAM)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2580 instream = source->lisp_object;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2581 else if (source_type == DFC_TYPE_DATA)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2582 streams_to_delete[delete_count++] = instream =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2583 make_fixed_buffer_input_stream (source->data.ptr, source->data.len);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2584 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2585 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2586 type_checking_assert (source_type == DFC_TYPE_LISP_STRING);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2587 streams_to_delete[delete_count++] = instream =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2588 /* This will GCPRO the Lisp string */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2589 make_lisp_string_input_stream (source->lisp_object, 0, -1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2590 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2591

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2592 if (sink_type == DFC_TYPE_LISP_LSTREAM)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2593 outstream = sink->lisp_object;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2594 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2595 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2596 type_checking_assert (sink_type == DFC_TYPE_DATA);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2597 streams_to_delete[delete_count++] = outstream =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2598 make_dynarr_output_stream

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2599 ((unsigned_char_dynarr *) conversion_out_dynarr);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2600 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2601

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2602 streams_to_delete[delete_count++] = outstream =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2603 make_coding_output_stream (XLSTREAM (outstream), coding_system, CODING_ENCODE);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2604

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2605 reader = XLSTREAM (instream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2606 writer = XLSTREAM (outstream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2607 /* decoding_stream will gc-protect outstream */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2608 GCPRO2 (instream, outstream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2609

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2610 while (1)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2611 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2612 Bytecount size_in_bytes;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2613 char tempbuf[1024]; /* some random amount */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2614

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2615 size_in_bytes = Lstream_read (reader, tempbuf, sizeof (tempbuf));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2616

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2617 if (size_in_bytes == 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2618 break;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2619 else if (size_in_bytes < 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2620 signal_error (Qtext_conversion_error,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2621 "Error converting to external format", Qunbound);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2622

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2623 if (Lstream_write (writer, tempbuf, size_in_bytes) < 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2624 signal_error (Qtext_conversion_error,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2625 "Error converting to external format", Qunbound);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2626 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2627

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2628 /* Closing writer will close any stream at the other end of writer. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2629 Lstream_close (writer);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2630 Lstream_close (reader);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2631 UNGCPRO;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2632

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2633 /* The idea is that this function will create no garbage. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2634 while (delete_count)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2635 Lstream_delete (XLSTREAM (streams_to_delete [--delete_count]));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2636 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2637

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2638 unbind_to (count);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2639

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2640 if (sink_type != DFC_TYPE_LISP_LSTREAM)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2641 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2642 sink->data.len = Dynarr_length (conversion_out_dynarr);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2643 /* double zero-extend because we may be dealing with Unicode data */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2644 Dynarr_add (conversion_out_dynarr, '\0');

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2645 Dynarr_add (conversion_out_dynarr, '\0');

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2646 sink->data.ptr = Dynarr_atp (conversion_out_dynarr, 0);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2647 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2648 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2649

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2650 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2651 dfc_convert_to_internal_format (dfc_conversion_type source_type,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2652 dfc_conversion_data *source,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2653 Lisp_Object coding_system,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2654 dfc_conversion_type sink_type,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2655 dfc_conversion_data *sink)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2656 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2657 /* It's guaranteed that many callers are not prepared for GC here,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2658 esp. given that this code conversion occurs in many very hidden

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2659 places. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2660 int count = begin_gc_forbidden ();

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2661 Intbyte_dynarr *conversion_in_dynarr;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2662

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2663 type_checking_assert

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2664 ((source_type == DFC_TYPE_DATA ||

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2665 source_type == DFC_TYPE_LISP_LSTREAM)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2666 &&

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2667 (sink_type == DFC_TYPE_DATA ||

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2668 sink_type == DFC_TYPE_LISP_LSTREAM));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2669

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2670 record_unwind_protect (dfc_convert_to_internal_format_reset_in_use,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2671 make_int (dfc_convert_to_internal_format_in_use));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2672 if (Dynarr_length (conversion_in_dynarr_list) <=

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2673 dfc_convert_to_internal_format_in_use)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2674 Dynarr_add (conversion_in_dynarr_list, Dynarr_new (Intbyte));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2675 conversion_in_dynarr = Dynarr_at (conversion_in_dynarr_list,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2676 dfc_convert_to_internal_format_in_use);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2677 dfc_convert_to_internal_format_in_use++;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2678 Dynarr_reset (conversion_in_dynarr);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2679

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2680 coding_system = get_coding_system_for_text_file (coding_system, 1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2681

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2682 if (source_type != DFC_TYPE_LISP_LSTREAM &&

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2683 sink_type != DFC_TYPE_LISP_LSTREAM &&

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2684 coding_system_is_binary (coding_system))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2685 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2686 #ifdef MULE

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2687 const Intbyte *ptr = (const Intbyte *) source->data.ptr;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2688 Bytecount len = source->data.len;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2689 const Intbyte *end = ptr + len;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2690

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2691 for (; ptr < end; ptr++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2692 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2693 Intbyte c = *ptr;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2694

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2695 if (BYTE_ASCII_P (c))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2696 Dynarr_add (conversion_in_dynarr, c);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2697 else if (BYTE_C1_P (c))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2698 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2699 Dynarr_add (conversion_in_dynarr, LEADING_BYTE_CONTROL_1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2700 Dynarr_add (conversion_in_dynarr, c + 0x20);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2701 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2702 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2703 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2704 Dynarr_add (conversion_in_dynarr, LEADING_BYTE_LATIN_ISO8859_1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2705 Dynarr_add (conversion_in_dynarr, c);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2706 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2707 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2708 #else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2709 Dynarr_add_many (conversion_in_dynarr, source->data.ptr, source->data.len);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2710 #endif

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2711 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2712 #ifdef HAVE_WIN32_CODING_SYSTEMS

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2713 /* Optimize the common case involving Unicode where only ASCII/Latin-1 is involved */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2714 else if (source_type != DFC_TYPE_LISP_LSTREAM &&

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2715 sink_type != DFC_TYPE_LISP_LSTREAM &&

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2716 dfc_coding_system_is_unicode (coding_system))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2717 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2718 const Intbyte *ptr = (const Intbyte *) source->data.ptr + 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2719 Bytecount len = source->data.len;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2720 const Intbyte *end = ptr + len;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2721

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2722 if (len & 1)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2723 goto the_hard_way;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2724

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2725 for (; ptr < end; ptr += 2)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2726 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2727 if (*ptr)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2728 goto the_hard_way;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2729 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2730

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2731 ptr = (const Intbyte *) source->data.ptr;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2732 end = ptr + len;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2733

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2734 for (; ptr < end; ptr += 2)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2735 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2736 Intbyte c = *ptr;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2737

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2738 if (BYTE_ASCII_P (c))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2739 Dynarr_add (conversion_in_dynarr, c);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2740 #ifdef MULE

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2741 else if (BYTE_C1_P (c))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2742 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2743 Dynarr_add (conversion_in_dynarr, LEADING_BYTE_CONTROL_1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2744 Dynarr_add (conversion_in_dynarr, c + 0x20);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2745 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2746 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2747 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2748 Dynarr_add (conversion_in_dynarr, LEADING_BYTE_LATIN_ISO8859_1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2749 Dynarr_add (conversion_in_dynarr, c);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2750 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2751 #endif /* MULE */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2752 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2753 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2754 #endif /* HAVE_WIN32_CODING_SYSTEMS */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2755 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2756 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2757 Lisp_Object streams_to_delete[3];

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2758 int delete_count;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2759 Lisp_Object instream, outstream;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2760 Lstream *reader, *writer;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2761 struct gcpro gcpro1, gcpro2;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2762

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2763 #ifdef HAVE_WIN32_CODING_SYSTEMS

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2764 the_hard_way:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2765 #endif /* HAVE_WIN32_CODING_SYSTEMS */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2766 delete_count = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2767 if (source_type == DFC_TYPE_LISP_LSTREAM)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2768 instream = source->lisp_object;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2769 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2770 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2771 type_checking_assert (source_type == DFC_TYPE_DATA);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2772 streams_to_delete[delete_count++] = instream =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2773 make_fixed_buffer_input_stream (source->data.ptr, source->data.len);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2774 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2775

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2776 if (sink_type == DFC_TYPE_LISP_LSTREAM)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2777 outstream = sink->lisp_object;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2778 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2779 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2780 type_checking_assert (sink_type == DFC_TYPE_DATA);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2781 streams_to_delete[delete_count++] = outstream =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2782 make_dynarr_output_stream

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2783 ((unsigned_char_dynarr *) conversion_in_dynarr);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2784 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2785

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2786 streams_to_delete[delete_count++] = outstream =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2787 make_coding_output_stream (XLSTREAM (outstream), coding_system, CODING_DECODE);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2788

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2789 reader = XLSTREAM (instream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2790 writer = XLSTREAM (outstream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2791 /* outstream will gc-protect its sink stream, if necessary */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2792 GCPRO2 (instream, outstream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2793

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2794 while (1)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2795 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2796 Bytecount size_in_bytes;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2797 char tempbuf[1024]; /* some random amount */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2798

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2799 size_in_bytes = Lstream_read (reader, tempbuf, sizeof (tempbuf));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2800

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2801 if (size_in_bytes == 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2802 break;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2803 else if (size_in_bytes < 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2804 signal_error (Qtext_conversion_error,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2805 "Error converting to internal format", Qunbound);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2806

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2807 if (Lstream_write (writer, tempbuf, size_in_bytes) < 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2808 signal_error (Qtext_conversion_error,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2809 "Error converting to internal format", Qunbound);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2810 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2811

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2812 /* Closing writer will close any stream at the other end of writer. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2813 Lstream_close (writer);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2814 Lstream_close (reader);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2815 UNGCPRO;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2816

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2817 /* The idea is that this function will create no garbage. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2818 while (delete_count)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2819 Lstream_delete (XLSTREAM (streams_to_delete [--delete_count]));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2820 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2821

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2822 unbind_to (count);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2823

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2824 if (sink_type != DFC_TYPE_LISP_LSTREAM)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2825 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2826 sink->data.len = Dynarr_length (conversion_in_dynarr);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2827 Dynarr_add (conversion_in_dynarr, '\0'); /* remember to NUL-terminate! */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2828 /* The macros don't currently distinguish between internal and

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2829 external sinks, and allocate and copy two extra bytes in both

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2830 cases. So we add a second zero, just like for external data

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2831 (in that case, because we may be converting to Unicode). */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2832 Dynarr_add (conversion_in_dynarr, '\0');

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2833 sink->data.ptr = Dynarr_atp (conversion_in_dynarr, 0);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2834 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2835 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2836

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2837

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2838 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2839 /* Basic Emchar functions */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2840 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2841

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2842 #ifdef MULE

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2843

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2844 /* Convert a non-ASCII Mule character C into a one-character Mule-encoded

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2845 string in STR. Returns the number of bytes stored.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2846 Do not call this directly. Use the macro set_charptr_emchar() instead.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2847 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2848

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2849 Bytecount

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2850 non_ascii_set_charptr_emchar (Intbyte *str, Emchar c)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2851 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2852 Intbyte *p;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2853 Intbyte lb;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2854 int c1, c2;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2855 Lisp_Object charset;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2856

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2857 p = str;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2858 BREAKUP_CHAR (c, charset, c1, c2);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2859 lb = CHAR_LEADING_BYTE (c);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2860 if (LEADING_BYTE_PRIVATE_P (lb))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2861 *p++ = PRIVATE_LEADING_BYTE_PREFIX (lb);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2862 *p++ = lb;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2863 if (EQ (charset, Vcharset_control_1))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2864 c1 += 0x20;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2865 *p++ = c1 | 0x80;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2866 if (c2)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2867 *p++ = c2 | 0x80;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2868

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2869 return (p - str);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2870 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2871

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2872 /* Return the first character from a Mule-encoded string in STR,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2873 assuming it's non-ASCII. Do not call this directly.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2874 Use the macro charptr_emchar() instead. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2875

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2876 Emchar

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2877 non_ascii_charptr_emchar (const Intbyte *str)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2878 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2879 Intbyte i0 = *str, i1, i2 = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2880 Lisp_Object charset;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2881

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2882 if (i0 == LEADING_BYTE_CONTROL_1)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2883 return (Emchar) (*++str - 0x20);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2884

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2885 if (LEADING_BYTE_PREFIX_P (i0))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2886 i0 = *++str;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2887

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2888 i1 = *++str & 0x7F;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2889

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2890 charset = CHARSET_BY_LEADING_BYTE (i0);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2891 if (XCHARSET_DIMENSION (charset) == 2)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2892 i2 = *++str & 0x7F;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2893

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2894 return MAKE_CHAR (charset, i1, i2);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2895 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2896

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2897 /* Return whether CH is a valid Emchar, assuming it's non-ASCII.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2898 Do not call this directly. Use the macro valid_char_p() instead. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2899

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2900 int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2901 non_ascii_valid_char_p (Emchar ch)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2902 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2903 int f1, f2, f3;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2904

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2905 /* Must have only lowest 19 bits set */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2906 if (ch & ~0x7FFFF)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2907 return 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2908

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2909 f1 = CHAR_FIELD1 (ch);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2910 f2 = CHAR_FIELD2 (ch);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2911 f3 = CHAR_FIELD3 (ch);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2912

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2913 if (f1 == 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2914 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2915 /* dimension-1 char */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2916 Lisp_Object charset;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2917

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2918 /* leading byte must be correct */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2919 if (f2 < MIN_CHAR_FIELD2_OFFICIAL ||

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2920 (f2 > MAX_CHAR_FIELD2_OFFICIAL && f2 < MIN_CHAR_FIELD2_PRIVATE) ||

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2921 f2 > MAX_CHAR_FIELD2_PRIVATE)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2922 return 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2923 /* octet not out of range */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2924 if (f3 < 0x20)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2925 return 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2926 /* charset exists */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2927 /*

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2928 NOTE: This takes advantage of the fact that

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2929 FIELD2_TO_OFFICIAL_LEADING_BYTE and

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2930 FIELD2_TO_PRIVATE_LEADING_BYTE are the same.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2931 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2932 charset = CHARSET_BY_LEADING_BYTE (f2 + FIELD2_TO_OFFICIAL_LEADING_BYTE);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2933 if (EQ (charset, Qnil))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2934 return 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2935 /* check range as per size (94 or 96) of charset */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2936 return ((f3 > 0x20 && f3 < 0x7f) || XCHARSET_CHARS (charset) == 96);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2937 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2938 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2939 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2940 /* dimension-2 char */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2941 Lisp_Object charset;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2942

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2943 /* leading byte must be correct */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2944 if (f1 < MIN_CHAR_FIELD1_OFFICIAL ||

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2945 (f1 > MAX_CHAR_FIELD1_OFFICIAL && f1 < MIN_CHAR_FIELD1_PRIVATE) ||

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2946 f1 > MAX_CHAR_FIELD1_PRIVATE)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2947 return 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2948 /* octets not out of range */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2949 if (f2 < 0x20 || f3 < 0x20)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2950 return 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2951

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2952 #ifdef ENABLE_COMPOSITE_CHARS

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2953 if (f1 + FIELD1_TO_OFFICIAL_LEADING_BYTE == LEADING_BYTE_COMPOSITE)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2954 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2955 if (UNBOUNDP (Fgethash (make_int (ch),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2956 Vcomposite_char_char2string_hash_table,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2957 Qunbound)))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2958 return 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2959 return 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2960 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2961 #endif /* ENABLE_COMPOSITE_CHARS */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2962

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2963 /* charset exists */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2964 if (f1 <= MAX_CHAR_FIELD1_OFFICIAL)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2965 charset =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2966 CHARSET_BY_LEADING_BYTE (f1 + FIELD1_TO_OFFICIAL_LEADING_BYTE);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2967 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2968 charset =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2969 CHARSET_BY_LEADING_BYTE (f1 + FIELD1_TO_PRIVATE_LEADING_BYTE);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2970

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2971 if (EQ (charset, Qnil))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2972 return 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2973 /* check range as per size (94x94 or 96x96) of charset */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2974 return ((f2 != 0x20 && f2 != 0x7F && f3 != 0x20 && f3 != 0x7F) ||

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2975 XCHARSET_CHARS (charset) == 96);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2976 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2977 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2978

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2979 /* Copy the character pointed to by SRC into DST. Do not call this

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2980 directly. Use the macro charptr_copy_char() instead.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2981 Return the number of bytes copied. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2982

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2983 Bytecount

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2984 non_ascii_charptr_copy_char (const Intbyte *src, Intbyte *dst)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2985 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2986 Bytecount bytes = REP_BYTES_BY_FIRST_BYTE (*src);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2987 Bytecount i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2988 for (i = bytes; i; i--, dst++, src++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2989 *dst = *src;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2990 return bytes;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2991 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2992

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2993 #endif /* MULE */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2994

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2995

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2996 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2997 /* streams of Emchars */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2998 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2999

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3000 #ifdef MULE

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3001

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3002 /* Treat a stream as a stream of Emchar's rather than a stream of bytes.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3003 The functions below are not meant to be called directly; use

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3004 the macros in insdel.h. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3005

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3006 Emchar

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3007 Lstream_get_emchar_1 (Lstream *stream, int ch)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3008 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3009 Intbyte str[MAX_EMCHAR_LEN];

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3010 Intbyte *strptr = str;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3011 Bytecount bytes;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3012

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3013 str[0] = (Intbyte) ch;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3014

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3015 for (bytes = REP_BYTES_BY_FIRST_BYTE (ch) - 1; bytes; bytes--)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3016 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3017 int c = Lstream_getc (stream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3018 charbpos_checking_assert (c >= 0);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3019 *++strptr = (Intbyte) c;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3020 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3021 return charptr_emchar (str);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3022 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3023

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3024 int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3025 Lstream_fput_emchar (Lstream *stream, Emchar ch)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3026 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3027 Intbyte str[MAX_EMCHAR_LEN];

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3028 Bytecount len = set_charptr_emchar (str, ch);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3029 return Lstream_write (stream, str, len);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3030 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3031

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3032 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3033 Lstream_funget_emchar (Lstream *stream, Emchar ch)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3034 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3035 Intbyte str[MAX_EMCHAR_LEN];

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3036 Bytecount len = set_charptr_emchar (str, ch);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3037 Lstream_unread (stream, str, len);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3038 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3039

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3040 #endif /* MULE */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3041

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3042

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3043 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3044 /* Lisp primitives for working with characters */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3045 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3046

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3047 DEFUN ("make-char", Fmake_char, 2, 3, 0, /*

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3048 Make a character from CHARSET and octets ARG1 and ARG2.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3049 ARG2 is required only for characters from two-dimensional charsets.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3050

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3051 Each octet should be in the range 32 through 127 for a 96 or 96x96

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3052 charset and 33 through 126 for a 94 or 94x94 charset. (Most charsets

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3053 are either 96 or 94x94.) Note that this is 32 more than the values

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3054 typically given for 94x94 charsets. When two octets are required, the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3055 order is "standard" -- the same as appears in ISO-2022 encodings,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3056 reference tables, etc.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3057

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3058 \(Note the following non-obvious result: Computerized translation

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3059 tables often encode the two octets as the high and low bytes,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3060 respectively, of a hex short, while when there's only one octet, it

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3061 goes in the low byte. When decoding such a value, you need to treat

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3062 the two cases differently when calling make-char: One is (make-char

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3063 CHARSET HIGH LOW), the other is (make-char CHARSET LOW).)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3064

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3065 For example, (make-char 'latin-iso8859-2 185) or (make-char

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3066 'latin-iso8859-2 57) will return the Latin 2 character s with caron.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3067

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3068 As another example, the Japanese character for "kawa" (stream), which

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3069 looks something like this:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3070

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3071 | |

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3072 | | |

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3073 | | |

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3074 | | |

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3075 / |

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3076

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3077 appears in the Unicode Standard (version 2.0) on page 7-287 with the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3078 following values (see also page 7-4):

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3079

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3080 U 5DDD (Unicode)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3081 G 0-2008 (GB 2312-80)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3082 J 0-3278 (JIS X 0208-1990)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3083 K 0-8425 (KS C 5601-1987)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3084 B A474 (Big Five)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3085 C 1-4455 (CNS 11643-1986 (1st plane))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3086 A 213C34 (ANSI Z39.64-1989)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3087

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3088 These are equivalent to:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3089

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3090 \(make-char 'chinese-gb2312 52 40)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3091 \(make-char 'japanese-jisx0208 64 110)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3092 \(make-char 'korean-ksc5601 116 57)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3093 \(make-char 'chinese-cns11643-1 76 87)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3094 \(decode-big5-char '(164 . 116))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3095

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3096 \(All codes above are two decimal numbers except for Big Five and ANSI

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3097 Z39.64, which we don't support. We add 32 to each of the decimal

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3098 numbers. Big Five is split in a rather hackish fashion into two

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3099 charsets, `big5-1' and `big5-2', due to its excessive size -- 94x157,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3100 with the first codepoint in the range 0xA1 to 0xFE and the second in

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3101 the range 0x40 to 0x7E or 0xA1 to 0xFE. `decode-big5-char' is used to

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3102 generate the char from its codes, and `encode-big5-char' extracts the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3103 codes.)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3104

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3105 When compiled without MULE, this function does not do much, but it's

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3106 provided for compatibility. In this case, the following CHARSET symbols

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3107 are allowed:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3108

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3109 `ascii' -- ARG1 should be in the range 0 through 127.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3110 `control-1' -- ARG1 should be in the range 128 through 159.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3111 else -- ARG1 is coerced to be between 0 and 255, and then the high

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3112 bit is set.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3113

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3114 `int-to-char of the resulting ARG1' is returned, and ARG2 is always ignored.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3115 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3116 (charset, arg1, arg2))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3117 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3118 #ifdef MULE

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3119 Lisp_Charset *cs;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3120 int a1, a2;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3121 int lowlim, highlim;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3122

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3123 charset = Fget_charset (charset);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3124 cs = XCHARSET (charset);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3125

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3126 if (EQ (charset, Vcharset_ascii)) lowlim = 0, highlim = 127;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3127 else if (EQ (charset, Vcharset_control_1)) lowlim = 0, highlim = 31;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3128 else if (CHARSET_CHARS (cs) == 94) lowlim = 33, highlim = 126;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3129 else /* CHARSET_CHARS (cs) == 96) */ lowlim = 32, highlim = 127;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3130

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3131 CHECK_INT (arg1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3132 /* It is useful (and safe, according to Olivier Galibert) to strip

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3133 the 8th bit off ARG1 and ARG2 because it allows programmers to

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3134 write (make-char 'latin-iso8859-2 CODE) where code is the actual

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3135 Latin 2 code of the character. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3136 a1 = XINT (arg1) & 0x7f;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3137 if (a1 < lowlim || a1 > highlim)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3138 args_out_of_range_3 (arg1, make_int (lowlim), make_int (highlim));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3139

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3140 if (CHARSET_DIMENSION (cs) == 1)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3141 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3142 if (!NILP (arg2))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3143 invalid_argument

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3144 ("Charset is of dimension one; second octet must be nil", arg2);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3145 return make_char (MAKE_CHAR (charset, a1, 0));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3146 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3147

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3148 CHECK_INT (arg2);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3149 a2 = XINT (arg2) & 0x7f;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3150 if (a2 < lowlim || a2 > highlim)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3151 args_out_of_range_3 (arg2, make_int (lowlim), make_int (highlim));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3152

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3153 return make_char (MAKE_CHAR (charset, a1, a2));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3154 #else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3155 int a1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3156 int lowlim, highlim;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3157

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3158 if (EQ (charset, Qascii)) lowlim = 0, highlim = 127;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3159 else if (EQ (charset, Qcontrol_1)) lowlim = 0, highlim = 31;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3160 else lowlim = 0, highlim = 127;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3161

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3162 CHECK_INT (arg1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3163 /* It is useful (and safe, according to Olivier Galibert) to strip

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3164 the 8th bit off ARG1 and ARG2 because it allows programmers to

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3165 write (make-char 'latin-iso8859-2 CODE) where code is the actual

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3166 Latin 2 code of the character. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3167 a1 = XINT (arg1) & 0x7f;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3168 if (a1 < lowlim || a1 > highlim)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3169 args_out_of_range_3 (arg1, make_int (lowlim), make_int (highlim));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3170

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3171 if (EQ (charset, Qascii))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3172 return make_char (a1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3173 return make_char (a1 + 128);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3174 #endif /* MULE */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3175 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3176

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3177 #ifdef MULE

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3178

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3179 DEFUN ("char-charset", Fchar_charset, 1, 1, 0, /*

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3180 Return the character set of char CH.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3181 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3182 (ch))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3183 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3184 CHECK_CHAR_COERCE_INT (ch);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3185

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3186 return XCHARSET_NAME (CHARSET_BY_LEADING_BYTE

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3187 (CHAR_LEADING_BYTE (XCHAR (ch))));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3188 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3189

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3190 DEFUN ("char-octet", Fchar_octet, 1, 2, 0, /*

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3191 Return the octet numbered N (should be 0 or 1) of char CH.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3192 N defaults to 0 if omitted.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3193 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3194 (ch, n))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3195 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3196 Lisp_Object charset;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3197 int octet0, octet1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3198

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3199 CHECK_CHAR_COERCE_INT (ch);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3200

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3201 BREAKUP_CHAR (XCHAR (ch), charset, octet0, octet1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3202

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3203 if (NILP (n) || EQ (n, Qzero))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3204 return make_int (octet0);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3205 else if (EQ (n, make_int (1)))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3206 return make_int (octet1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3207 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3208 invalid_constant ("Octet number must be 0 or 1", n);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3209 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3210

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3211 DEFUN ("split-char", Fsplit_char, 1, 1, 0, /*

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3212 Return list of charset and one or two position-codes of CHAR.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3213 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3214 (character))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3215 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3216 /* This function can GC */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3217 struct gcpro gcpro1, gcpro2;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3218 Lisp_Object charset = Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3219 Lisp_Object rc = Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3220 int c1, c2;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3221

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3222 GCPRO2 (charset, rc);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3223 CHECK_CHAR_COERCE_INT (character);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3224

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3225 BREAKUP_CHAR (XCHAR (character), charset, c1, c2);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3226

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3227 if (XCHARSET_DIMENSION (Fget_charset (charset)) == 2)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3228 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3229 rc = list3 (XCHARSET_NAME (charset), make_int (c1), make_int (c2));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3230 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3231 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3232 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3233 rc = list2 (XCHARSET_NAME (charset), make_int (c1));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3234 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3235 UNGCPRO;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3236

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3237 return rc;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3238 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3239

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3240 #endif /* MULE */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3241

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3242

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3243 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3244 /* composite character functions */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3245 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3246

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3247 #ifdef ENABLE_COMPOSITE_CHARS

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3248

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3249 Emchar

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3250 lookup_composite_char (Intbyte *str, int len)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3251 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3252 Lisp_Object lispstr = make_string (str, len);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3253 Lisp_Object ch = Fgethash (lispstr,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3254 Vcomposite_char_string2char_hash_table,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3255 Qunbound);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3256 Emchar emch;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3257

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3258 if (UNBOUNDP (ch))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3259 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3260 if (composite_char_row_next >= 128)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3261 invalid_operation ("No more composite chars available", lispstr);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3262 emch = MAKE_CHAR (Vcharset_composite, composite_char_row_next,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3263 composite_char_col_next);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3264 Fputhash (make_char (emch), lispstr,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3265 Vcomposite_char_char2string_hash_table);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3266 Fputhash (lispstr, make_char (emch),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3267 Vcomposite_char_string2char_hash_table);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3268 composite_char_col_next++;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3269 if (composite_char_col_next >= 128)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3270 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3271 composite_char_col_next = 32;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3272 composite_char_row_next++;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3273 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3274 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3275 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3276 emch = XCHAR (ch);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3277 return emch;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3278 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3279

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3280 Lisp_Object

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3281 composite_char_string (Emchar ch)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3282 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3283 Lisp_Object str = Fgethash (make_char (ch),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3284 Vcomposite_char_char2string_hash_table,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3285 Qunbound);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3286 assert (!UNBOUNDP (str));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3287 return str;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3288 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3289

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3290 xxDEFUN ("make-composite-char", Fmake_composite_char, 1, 1, 0, /*

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3291 Convert a string into a single composite character.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3292 The character is the result of overstriking all the characters in

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3293 the string.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3294 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3295 (string))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3296 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3297 CHECK_STRING (string);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3298 return make_char (lookup_composite_char (XSTRING_DATA (string),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3299 XSTRING_LENGTH (string)));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3300 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3301

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3302 xxDEFUN ("composite-char-string", Fcomposite_char_string, 1, 1, 0, /*

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3303 Return a string of the characters comprising a composite character.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3304 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3305 (ch))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3306 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3307 Emchar emch;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3308

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3309 CHECK_CHAR (ch);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3310 emch = XCHAR (ch);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3311 if (CHAR_LEADING_BYTE (emch) != LEADING_BYTE_COMPOSITE)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3312 invalid_argument ("Must be composite char", ch);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3313 return composite_char_string (emch);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3314 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3315 #endif /* ENABLE_COMPOSITE_CHARS */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3316

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3317

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3318 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3319 /* initialization */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3320 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3321

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3322 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3323 init_eistring_once_early (void)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3324 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3325 the_eistring_malloc_zero_init = the_eistring_zero_init;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3326 the_eistring_malloc_zero_init.mallocp_ = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3327 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3328

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3329 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3330 syms_of_text (void)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3331 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3332 DEFSUBR (Fmake_char);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3333

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3334 #ifdef MULE

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3335 DEFSUBR (Fchar_charset);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3336 DEFSUBR (Fchar_octet);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3337 DEFSUBR (Fsplit_char);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3338

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3339 #ifdef ENABLE_COMPOSITE_CHARS

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3340 DEFSUBR (Fmake_composite_char);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3341 DEFSUBR (Fcomposite_char_string);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3342 #endif

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3343 #endif /* MULE */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3344 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3345

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3346 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3347 reinit_vars_of_text (void)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3348 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3349 int i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3350

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3351 conversion_in_dynarr_list = Dynarr_new2 (Intbyte_dynarr_dynarr,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3352 Intbyte_dynarr *);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3353 conversion_out_dynarr_list = Dynarr_new2 (Extbyte_dynarr_dynarr,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3354 Extbyte_dynarr *);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3355

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3356 /* #### Olivier, why does this need to be reinitted? */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3357 for (i = 0; i <= MAX_BYTEBPOS_GAP_SIZE_3; i++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3358 three_to_one_table[i] = i / 3;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3359 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3360

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3361 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3362 vars_of_text (void)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3363 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3364 reinit_vars_of_text ();

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3365

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3366 #ifdef ENABLE_COMPOSITE_CHARS

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3367 /* #### not dumped properly */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3368 composite_char_row_next = 32;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3369 composite_char_col_next = 32;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3370

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3371 Vcomposite_char_string2char_hash_table =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3372 make_lisp_hash_table (500, HASH_TABLE_NON_WEAK, HASH_TABLE_EQUAL);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3373 Vcomposite_char_char2string_hash_table =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3374 make_lisp_hash_table (500, HASH_TABLE_NON_WEAK, HASH_TABLE_EQ);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3375 staticpro (&Vcomposite_char_string2char_hash_table);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3376 staticpro (&Vcomposite_char_char2string_hash_table);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3377 #endif /* ENABLE_COMPOSITE_CHARS */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3378 }

Mercurial > hg > xemacs-beta

annotate src/text.c @ 771:943eaba38521