xemacs-beta: src/text.c annotate

author	ben
date	Mon, 24 Jan 2005 23:34:34 +0000 (2005-01-24)
parents	ab71ad6ff3dd
children	e01408ac6580

rev	line source
2367 ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	1 /* Text manipulation primitives for XEmacs.
771 943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	2 Copyright (C) 1995 Sun Microsystems, Inc.
2367 ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	3 Copyright (C) 1995, 1996, 2000, 2001, 2002, 2003, 2004 Ben Wing.
771 943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	4 Copyright (C) 1999 Martin Buchholz.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	5
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	6 This file is part of XEmacs.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	7
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	8 XEmacs is free software; you can redistribute it and/or modify it
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	9 under the terms of the GNU General Public License as published by the
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	10 Free Software Foundation; either version 2, or (at your option) any
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	11 later version.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	12
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	13 XEmacs is distributed in the hope that it will be useful, but WITHOUT
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	14 ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	15 FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	16 for more details.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	17
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	18 You should have received a copy of the GNU General Public License
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	19 along with XEmacs; see the file COPYING. If not, write to
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	20 the Free Software Foundation, Inc., 59 Temple Place - Suite 330,
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	21 Boston, MA 02111-1307, USA. */
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	22
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	23 /* Synched up with: Not in FSF. */
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	24
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	25 /* Authorship:
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	26 */
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	27
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	28 #include <config.h>
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	29 #include "lisp.h"
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	30
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	31 #include "buffer.h"
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	32 #include "charset.h"
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	33 #include "file-coding.h"
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	34 #include "lstream.h"
1292 f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben] ben parents: 1204 diff changeset	35 #include "profile.h"
771 943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	36
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	37
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	38 /************************************************************************/
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	39 /* long comments */
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	40 /************************************************************************/
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	41
2367 ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	42 /* NB: Everything below was written by Ben Wing except as otherwise noted. */
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	43
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	44 /************************************************************************/
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	45 /* */
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	46 /* */
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	47 /* Part A: More carefully-written documentation */
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	48 /* */
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	49 /* */
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	50 /************************************************************************/
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	51
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	52 /* Authorship: Ben Wing
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	53
771 943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	54
826 6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben] ben parents: 814 diff changeset	55 ==========================================================================
2367 ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	56 7. Handling non-default formats
826 6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben] ben parents: 814 diff changeset	57 ==========================================================================
771 943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	58
2367 ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	59 We support, at least to some extent, formats other than the default
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	60 variable-width format, for speed; all of these alternative formats are
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	61 fixed-width. Currently we only handle these non-default formats in
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	62 buffers, because access to their text is strictly controlled and thus
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	63 the details of the format mostly compartmentalized. The only really
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	64 tricky part is the search code -- the regex, Boyer-Moore, and
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	65 simple-search algorithms in search.c and regex.c. All other code that
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	66 knows directly about the buffer representation is the basic code to
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	67 modify or retrieve the buffer text.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	68
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	69 Supporting fixed-width formats in Lisp strings is harder, but possible
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	70 -- FSF currently does this, for example. In this case, however,
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	71 probably only 8-bit-fixed is reasonable for Lisp strings -- getting
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	72 non-ASCII-compatible fixed-width formats to work is much, much harder
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	73 because a lot of code assumes that strings are ASCII-compatible
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	74 (i.e. ASCII + other characters represented exclusively using high-bit
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	75 bytes) and a lot of code mixes Lisp strings and non-Lisp strings freely.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	76
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	77 The different possible fixed-width formats are 8-bit fixed, 16-bit
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	78 fixed, and 32-bit fixed. The latter can represent all possible
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	79 characters, but at a substantial memory penalty. The other two can
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	80 represent only a subset of the possible characters. How these subsets
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	81 are defined can be simple or very tricky.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	82
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	83 Currently we support only the default format and the 8-bit fixed format,
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	84 and in the latter, we only allow these to be the first 256 characters in
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	85 an Ichar (ASCII and Latin 1).
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	86
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	87 One reasonable approach for 8-bit fixed is to allow the upper half to
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	88 represent any 1-byte charset, which is specified on a per-buffer basis.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	89 This should work fairly well in practice since most documents are in
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	90 only one foreign language (possibly with some English mixed in). I
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	91 think FSF does something like this; or at least, they have something
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	92 called nonascii-translation-table and use it when converting from
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	93 8-bit-fixed text ("unibyte text") to default text ("multibyte text").
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	94 With 16-bit fixed, you could do something like assign chunks of the 64K
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	95 worth of characters to charsets as they're encountered in documents.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	96 This should work well with most Asian documents.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	97
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	98 If/when we switch to using Unicode internally, we might have formats more
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	99 like this:
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	100
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	101 -- UTF-8 or some extension as the default format. Perl uses an
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	102 extension that handles 64-bit chars and requires as much as 13 bytes per
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	103 char, vs. the standard of 31-bit chars and 6 bytes max. UTF-8 has the
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	104 same basic properties as our own variable-width format (see text.c,
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	105 Internal String Encoding) and so most code would not need to be changed.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	106
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	107 -- UTF-16 as a "pseudo-fixed" format (i.e. 16-bit fixed plus surrogates
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	108 for representing characters not in the BMP, aka >= 65536). The vast
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	109 majority of documents will have no surrogates in them so byte/char
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	110 conversion will be very fast.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	111
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	112 -- an 8-bit fixed format, like currently.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	113
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	114 -- possibly, UCS-4 as a 32-bit fixed format.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	115
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	116 The fixed-width formats essentially treat the buffer as an array of
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	117 8-bit, 16-bit or 32-bit integers. This means that how they are stored
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	118 in memory (in particular, big-endian or little-endian) depends on the
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	119 native format of the machine's processor. It also means we have to
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	120 worry a bit about alignment (basically, we just need to keep the gap an
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	121 integral size of the character size, and get things aligned properly
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	122 when converting the buffer between formats).
826 6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben] ben parents: 814 diff changeset	123
6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben] ben parents: 814 diff changeset	124 ==========================================================================
2367 ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	125 8. Using UTF-16 as the default text format
826 6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben] ben parents: 814 diff changeset	126 ==========================================================================
6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben] ben parents: 814 diff changeset	127
2367 ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	128 NOTE: The Eistring API is (or should be) Mule-correct even without
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	129 an ASCII-compatible internal representation.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	130
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	131 #### Currently, the assumption that text units are one byte in size is
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	132 embedded throughout XEmacs, and `Ibyte ' is used where `Itext ' should
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	133 be. The way to fix this is to (among other things)
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	134
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	135 (a) review all places referencing `Ibyte' and `Ibyte *', change them to
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	136 use Itext, and fix up the code.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	137 (b) change XSTRING_DATA to be of type Itext *
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	138 (c) review all uses of XSTRING_DATA
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	139 (d) eliminate XSTRING_LENGTH, splitting it into XSTRING_BYTE_LENGTH and
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	140 XSTRING_TEXT_LENGTH and reviewing all places referencing this
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	141 (e) make similar changes to other API's that refer to the "length" of
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	142 something, such as qxestrlen() and eilen()
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	143 (f) review all use of `CIbyte *'. Currently this is usually a way of
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	144 passing literal ASCII text strings in places that want internal text.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	145 Either create separate _ascii() and _itext() versions of the
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	146 functions taking CIbyte *, or make use of something like the
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	147 WEXTTEXT() macro, which will generate wide strings as appropriate.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	148 (g) review all uses of Bytecount and see which ones should be Textcount.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	149 (h) put in error-checking code that will be tripped as often as possible
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	150 when doing anything with internal text, and check to see that ASCII
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	151 text has not mistakenly filtered in. This should be fairly easy as
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	152 ASCII text will generally be entirely spaces and letters whereas every
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	153 second byte of Unicode text will generally be a null byte. Either we
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	154 abort if the second bytes are entirely letters and numbers, or,
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	155 perhaps better, do the equivalent of a non-MULE build, where we should
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	156 be dealing entirely with 8-bit characters, and assert that the high
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	157 bytes of each pair are null.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	158 (i) review places where xmalloc() is called. If we convert each use of
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	159 xmalloc() to instead be xnew_array() or some other typed routine,
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	160 then we will find every place that allocates space for Itext and
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	161 assumes it is based on one-byte units.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	162 (j) encourage the use of ITEXT_ZTERM_SIZE instead of '+ 1' whenever we
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	163 are adding space for a zero-terminator, to emphasize what we are
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	164 doing and make sure the calculations are correct. Similarly for
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	165 EXTTEXT_ZTERM_SIZE.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	166 (k) Note that the qxestr*() functions, among other things, will need to
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	167 be rewritten.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	168
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	169 Note that this is a lot of work, and is not high on the list of priorities
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	170 currently.
826 6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben] ben parents: 814 diff changeset	171
6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben] ben parents: 814 diff changeset	172 ==========================================================================
2367 ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	173 9. Miscellaneous
826 6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben] ben parents: 814 diff changeset	174 ==========================================================================
6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben] ben parents: 814 diff changeset	175
6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben] ben parents: 814 diff changeset	176 A. Unicode Support
771 943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	177
1292 f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben] ben parents: 1204 diff changeset	178 Unicode support is very desirable. Currrently we know how to handle
f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben] ben parents: 1204 diff changeset	179 externally-encoded Unicode data in various encodings -- UTF-16, UTF-8,
f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben] ben parents: 1204 diff changeset	180 etc. However, we really need to represent Unicode characters internally
f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben] ben parents: 1204 diff changeset	181 as-is, rather than converting to some language-specific character set.
f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben] ben parents: 1204 diff changeset	182 For efficiency, we should represent Unicode characters using 3 bytes
f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben] ben parents: 1204 diff changeset	183 rather than 4. This means we need to find leading bytes for Unicode.
f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben] ben parents: 1204 diff changeset	184 Given that there are 65,536 characters in Unicode and we can attach
f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben] ben parents: 1204 diff changeset	185 96x96 = 9,216 characters per leading byte, we need eight leading bytes
f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben] ben parents: 1204 diff changeset	186 for Unicode. We currently have four free (0x9A - 0x9D), and with a
f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben] ben parents: 1204 diff changeset	187 little bit of rearranging we can get five: ASCII doesn't really need to
f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben] ben parents: 1204 diff changeset	188 take up a leading byte. (We could just as well use 0x7F, with a little
f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben] ben parents: 1204 diff changeset	189 change to the functions that assume that 0x80 is the lowest leading
f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben] ben parents: 1204 diff changeset	190 byte.) This means we still need to dump three leading bytes and move
f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben] ben parents: 1204 diff changeset	191 them into private space. The CNS charsets are good candidates since
f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben] ben parents: 1204 diff changeset	192 they are rarely used, and JAPANESE_JISX0208_1978 is becoming less and
f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben] ben parents: 1204 diff changeset	193 less used and could also be dumped.
826 6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben] ben parents: 814 diff changeset	194
6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben] ben parents: 814 diff changeset	195 B. Composite Characters
6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben] ben parents: 814 diff changeset	196
6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben] ben parents: 814 diff changeset	197 Composite characters are characters constructed by overstriking two
771 943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	198 or more regular characters.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	199
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	200 1) The old Mule implementation involves storing composite characters
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	201 in a buffer as a tag followed by all of the actual characters
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	202 used to make up the composite character. I think this is a bad
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	203 idea; it greatly complicates code that wants to handle strings
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	204 one character at a time because it has to deal with the possibility
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	205 of great big ungainly characters. It's much more reasonable to
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	206 simply store an index into a table of composite characters.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	207
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	208 2) The current implementation only allows for 16,384 separate
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	209 composite characters over the lifetime of the XEmacs process.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	210 This could become a potential problem if the user
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	211 edited lots of different files that use composite characters.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	212 Due to FSF bogosity, increasing the number of allowable
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	213 composite characters under Mule would decrease the number
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	214 of possible faces that can exist. Mule already has shrunk
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	215 this to 2048, and further shrinkage would become uncomfortable.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	216 No such problems exist in XEmacs.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	217
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	218 Composite characters could be represented as 0x8D C1 C2 C3,
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	219 where each C[1-3] is in the range 0xA0 - 0xFF. This allows
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	220 for slightly under 2^20 (one million) composite characters
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	221 over the XEmacs process lifetime, and you only need to
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	222 increase the size of a Mule character from 19 to 21 bits.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	223 Or you could use 0x8D C1 C2 C3 C4, allowing for about
826 6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben] ben parents: 814 diff changeset	224 85 million (slightly over 2^26) composite characters.
6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben] ben parents: 814 diff changeset	225
2367 ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	226 ==========================================================================
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	227 10. Internal API's
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	228 ==========================================================================
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	229
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	230 All of these are documented in more detail in text.h.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	231
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	232 @enumerate
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	233 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	234 Basic internal-format API's
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	235
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	236 These are simple functions and macros to convert between text
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	237 representation and characters, move forward and back in text, etc.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	238
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	239 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	240 The DFC API
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	241
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	242 This is for conversion between internal and external text. Note that
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	243 there is also the "new DFC" API, which returns a pointer to the
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	244 converted text (in alloca space), rather than storing it into a
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	245 variable.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	246
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	247 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	248 The Eistring API
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	249
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	250 (This API is currently under-used) When doing simple things with
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	251 internal text, the basic internal-format API's are enough. But to do
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	252 things like delete or replace a substring, concatenate various strings,
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	253 etc. is difficult to do cleanly because of the allocation issues.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	254 The Eistring API is designed to deal with this, and provides a clean
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	255 way of modifying and building up internal text. (Note that the former
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	256 lack of this API has meant that some code uses Lisp strings to do
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	257 similar manipulations, resulting in excess garbage and increased
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	258 garbage collection.)
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	259
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	260 NOTE: The Eistring API is (or should be) Mule-correct even without
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	261 an ASCII-compatible internal representation.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	262 @end enumerate
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	263
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	264 ==========================================================================
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	265 11. Other Sources of Documentation
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	266 ==========================================================================
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	267
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	268 man/lispref/mule.texi
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	269 @enumerate
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	270 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	271 another intro to characters, encodings, etc; #### Merge with the
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	272 above info
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	273 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	274 documentation of ISO-2022
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	275 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	276 The charset and coding-system Lisp API's
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	277 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	278 The CCL conversion language for writing encoding conversions
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	279 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	280 The Latin-Unity package for unifying Latin charsets
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	281 @end enumerate
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	282
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	283 man/internals/internals.texi (the Internals manual)
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	284 @enumerate
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	285 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	286 "Coding for Mule" -- how to write Mule-aware code
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	287 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	288 "Modules for Internationalization"
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	289 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	290 "The Text in a Buffer" -- more about the different ways of
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	291 viewing buffer positions; #### Merge with the above info
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	292 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	293 "MULE Character Sets and Encodings" -- yet another intro
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	294 to characters, encodings, etc; #### Merge with the
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	295 above info; also some documentation of Japanese EUC and JIS7,
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	296 and CCL internals
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	297 @end enumerate
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	298
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	299 text.h -- info about specific XEmacs-C API's for handling internal and
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	300 external text
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	301
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	302 intl-win32.c -- Windows-specific I18N information
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	303
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	304 lisp.h -- some info appears alongside the definitions of the basic
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	305 character-related types
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	306
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	307 unicode.c -- documentation about Unicode translation tables
826 6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben] ben parents: 814 diff changeset	308 */
771 943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: diff changeset	309
2367 ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	310
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	311 /************************************************************************/
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	312 /* */
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	313 /* */
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	314 /* Part B: Random proposals for work to be done */
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	315 /* */
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	316 /* */
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	317 /************************************************************************/
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	318
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	319
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	320 /*
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	321
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	322
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	323 ==========================================================================
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	324 - Mule design issues (ben)
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	325 ==========================================================================
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	326
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	327 circa 1999
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	328
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	329 Here is a more detailed list of Mule-related projects that we will be
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	330 working on. They are more or less ordered according to how we will
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	331 proceed, but it's not exact. In particular, there will probably be
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	332 time overlap among adjacent projects.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	333
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	334 @enumerate
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	335 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	336 Modify the internal/external conversion macros to allow for
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	337 MS Windows support.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	338
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	339 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	340 Modify the buffer macros to allow for more than one internal
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	341 representation, e.g. fixed width and variable width.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	342
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	343 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	344 Review the existing Mule code, especially the lisp code, for code
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	345 quality issues and improve the cleanliness of it. Also work on
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	346 creating a specification for the Mule API.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	347
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	348 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	349 Write some more automated mule tests.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	350
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	351 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	352 Integrate Tomohiko's UTF-2000 code, fixing it up so that nothing is
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	353 broken when the UTF-2000 configure option is not enabled.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	354
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	355 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	356 Fix up the MS Windows code to be Mule-correct, so that you can
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	357 compile with Mule support under MS windows and have a working
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	358 XEmacs, at least just with Latin-1.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	359
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	360 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	361 Implement a scheme to guarantee no corruption of files, even with
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	362 an incorrect coding system - in particular, guarantee no corruption
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	363 of binary files.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	364
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	365 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	366 Make the text property support in XEmacs robust with respect to
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	367 string and text operations, so that the `no corruption' support in
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	368 the previous entry works properly, even if a lot of cutting and
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	369 pasting is done.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	370
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	371 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	372 Improve the handling of auto-detection so that, when there is any
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	373 possibility at all of mistake, the user is informed of the detected
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	374 encoding and given the choice of choosing other possibilities.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	375
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	376 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	377 Improve the support for different language environments in XEmacs,
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	378 for example, the priority of coding systems used in auto-detection
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	379 should properly reflect the language environment. This probably
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	380 necessitates rethinking the current `coding system priority'
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	381 scheme.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	382
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	383 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	384 Do quality work to improve the existing UTF-2000 implementation.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	385
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	386 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	387 Implement preliminary support for 8-bit fixed width
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	388 representation. First, we will only implement 7-bit support, and
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	389 will fall back to variable width as soon as any non-ASCII
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	390 character is encountered. Then we will improve the support to
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	391 handle an arbitrary character set in the upper half of the 8-bit space.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	392
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	393 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	394 Investigate any remaining hurdles to making --with-mule be the
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	395 default configure option.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	396 @end enumerate
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	397
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	398 ==========================================================================
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	399 - Mule design issues (stephen)
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	400 ==========================================================================
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	401
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	402 What I see as Mule priorities (in rough benefit order, I am not taking
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	403 account of difficulty, nor the fact that some - eg 8 & 10 - will
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	404 probably come as packages):
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	405
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	406 @enumerate
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	407 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	408 Fix the autodetect problem (by making the coding priority list
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	409 user-configurable, as short as he likes, even null, with "binary"
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	410 as the default).
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	411 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	412 Document the language environments and other Mule "APIs" as
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	413 implemented (since there is no real design spec). Check to see
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	414 how and where they are broken.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	415 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	416 Make the Mule menu useful to non-ISO-2022-literate folks.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	417 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	418 Redo the lstreams stuff to make it easy and robust to "pipeline",
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	419 eg, libz \| gnupg \| jis2mule.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	420 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	421 Make Custom Mule-aware. (This probably depends on a sensible
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	422 fonts model.)
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	423 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	424 Implement the "literal byte stream" memory feature.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	425 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	426 Study the FSF implementation of Mule for background for 7 & 8.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	427 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	428 Identify desirable Mule features (eg, i18n-ized messages as above,
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	429 collating tables by language environment, etc). (New features
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	430 might have priority as high as 9.)
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	431 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	432 Specify Mule UIs, APIs, etc, and design and (re)implement them.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	433 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	434 Implement the 8-bit-wide buffer optimization.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	435 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	436 Move the internal encoding to UTF-32 (subject to Olivier's caveats
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	437 regarding compose characters), with the variable-width char
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	438 buffers using UTF-8.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	439 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	440 Implement the 16- and 32-bit-wide buffer optimizations.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	441 @end enumerate
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	442
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	443 ==========================================================================
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	444 - Mule design issues "short term" (ben)
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	445 ==========================================================================
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	446
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	447 @enumerate
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	448 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	449 Finish changes in fixup/directory, get in CVS.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	450
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	451 (Test with and without "quick-build", to see if really faster)
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	452 (need autoconf)
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	453
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	454 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	455 Finish up Windows/Mule changes. Outline of this elsewhere; Do
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	456 minimal effort.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	457
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	458 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	459 Continue work on Windows stability, e.g. go through existing notes
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	460 on Windows Mule-ization + extract all info.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	461
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	462 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	463 Get Unicode translation tables integrated.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	464
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	465 Finish UCS2/UTF16 coding system.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	466
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	467 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	468 Make sure coding system priority list is language-environment specific.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	469
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	470 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	471 Consider moving language selection Menu up to be parallel with Mule menu.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	472
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	473 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	474 Check to make sure we grok the default locale at startup under
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	475 Windows and understand the Windows locales. Finish implementation
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	476 of mswindows-multibyte and make sure it groks all the locales.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	477
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	478 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	479 Do the above as best as we can without using Unicode tables.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	480
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	481 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	482 Start tagging all text with a language text property,
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	483 indicating the current language environment when the text was input.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	484
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	485 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	486 Make sure we correctly accept input of non-ASCII chars
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	487 (probably already do!)
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	488
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	489 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	490 Implement active language/keyboard switching under Windows.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	491
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	492 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	493 Look into implementing support for "MS IME" protocol (Microsoft
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	494 fancy built-in Asian input methods).
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	495
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	496 @item
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	497 Redo implementation of mswindows-multibyte and internal display to
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	498 entirely use translation to/from Unicode for increased accuracy.
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	499
ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben] ben parents: 2333 diff changeset	500 @item

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1 /* Text manipulation primitives for XEmacs.

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

6 This file is part of XEmacs.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

7

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

8 XEmacs is free software; you can redistribute it and/or modify it

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

9 under the terms of the GNU General Public License as published by the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

10 Free Software Foundation; either version 2, or (at your option) any

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

11 later version.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

12

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

13 XEmacs is distributed in the hope that it will be useful, but WITHOUT

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

14 ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

15 FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

16 for more details.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

17

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

18 You should have received a copy of the GNU General Public License

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

19 along with XEmacs; see the file COPYING. If not, write to

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

20 the Free Software Foundation, Inc., 59 Temple Place - Suite 330,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

21 Boston, MA 02111-1307, USA. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

22

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

23 /* Synched up with: Not in FSF. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

24

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

25 /* Authorship:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

26 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

27

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

28 #include <config.h>

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

29 #include "lisp.h"

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

30

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

31 #include "buffer.h"

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

32 #include "charset.h"

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

33 #include "file-coding.h"

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

34 #include "lstream.h"

1292

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

35 #include "profile.h"

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

36

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

37

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

38 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

39 /* long comments */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

40 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

41

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

42 /* NB: Everything below was written by Ben Wing except as otherwise noted. */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

43

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

44 /************************************************************************/

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

45 /* */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

46 /* */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

47 /* Part A: More carefully-written documentation */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

48 /* */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

49 /* */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

50 /************************************************************************/

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

51

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

52 /* Authorship: Ben Wing

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

53

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

54

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

55 ==========================================================================

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

56 7. Handling non-default formats

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

57 ==========================================================================

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

58

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

59 We support, at least to some extent, formats other than the default

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

60 variable-width format, for speed; all of these alternative formats are

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

61 fixed-width. Currently we only handle these non-default formats in

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

62 buffers, because access to their text is strictly controlled and thus

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

63 the details of the format mostly compartmentalized. The only really

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

64 tricky part is the search code -- the regex, Boyer-Moore, and

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

65 simple-search algorithms in search.c and regex.c. All other code that

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

66 knows directly about the buffer representation is the basic code to

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

67 modify or retrieve the buffer text.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

68

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

69 Supporting fixed-width formats in Lisp strings is harder, but possible

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

70 -- FSF currently does this, for example. In this case, however,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

71 probably only 8-bit-fixed is reasonable for Lisp strings -- getting

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

72 non-ASCII-compatible fixed-width formats to work is much, much harder

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

73 because a lot of code assumes that strings are ASCII-compatible

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

74 (i.e. ASCII + other characters represented exclusively using high-bit

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

75 bytes) and a lot of code mixes Lisp strings and non-Lisp strings freely.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

76

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

77 The different possible fixed-width formats are 8-bit fixed, 16-bit

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

78 fixed, and 32-bit fixed. The latter can represent all possible

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

79 characters, but at a substantial memory penalty. The other two can

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

80 represent only a subset of the possible characters. How these subsets

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

81 are defined can be simple or very tricky.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

82

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

83 Currently we support only the default format and the 8-bit fixed format,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

84 and in the latter, we only allow these to be the first 256 characters in

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

85 an Ichar (ASCII and Latin 1).

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

86

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

87 One reasonable approach for 8-bit fixed is to allow the upper half to

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

88 represent any 1-byte charset, which is specified on a per-buffer basis.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

89 This should work fairly well in practice since most documents are in

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

90 only one foreign language (possibly with some English mixed in). I

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

91 think FSF does something like this; or at least, they have something

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

92 called nonascii-translation-table and use it when converting from

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

93 8-bit-fixed text ("unibyte text") to default text ("multibyte text").

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

94 With 16-bit fixed, you could do something like assign chunks of the 64K

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

95 worth of characters to charsets as they're encountered in documents.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

96 This should work well with most Asian documents.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

97

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

98 If/when we switch to using Unicode internally, we might have formats more

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

99 like this:

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

100

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

101 -- UTF-8 or some extension as the default format. Perl uses an

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

102 extension that handles 64-bit chars and requires as much as 13 bytes per

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

103 char, vs. the standard of 31-bit chars and 6 bytes max. UTF-8 has the

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

104 same basic properties as our own variable-width format (see text.c,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

105 Internal String Encoding) and so most code would not need to be changed.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

106

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

107 -- UTF-16 as a "pseudo-fixed" format (i.e. 16-bit fixed plus surrogates

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

108 for representing characters not in the BMP, aka >= 65536). The vast

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

109 majority of documents will have no surrogates in them so byte/char

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

110 conversion will be very fast.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

111

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

112 -- an 8-bit fixed format, like currently.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

113

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

114 -- possibly, UCS-4 as a 32-bit fixed format.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

115

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

116 The fixed-width formats essentially treat the buffer as an array of

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

117 8-bit, 16-bit or 32-bit integers. This means that how they are stored

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

118 in memory (in particular, big-endian or little-endian) depends on the

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

119 native format of the machine's processor. It also means we have to

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

120 worry a bit about alignment (basically, we just need to keep the gap an

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

121 integral size of the character size, and get things aligned properly

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

122 when converting the buffer between formats).

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

123

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

124 ==========================================================================

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

125 8. Using UTF-16 as the default text format

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

126 ==========================================================================

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

127

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

128 NOTE: The Eistring API is (or should be) Mule-correct even without

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

129 an ASCII-compatible internal representation.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

130

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

131 #### Currently, the assumption that text units are one byte in size is

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

132 embedded throughout XEmacs, and `Ibyte *' is used where `Itext *' should

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

133 be. The way to fix this is to (among other things)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

134

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

135 (a) review all places referencing `Ibyte' and `Ibyte *', change them to

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

136 use Itext, and fix up the code.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

137 (b) change XSTRING_DATA to be of type Itext *

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

138 (c) review all uses of XSTRING_DATA

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

139 (d) eliminate XSTRING_LENGTH, splitting it into XSTRING_BYTE_LENGTH and

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

140 XSTRING_TEXT_LENGTH and reviewing all places referencing this

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

141 (e) make similar changes to other API's that refer to the "length" of

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

142 something, such as qxestrlen() and eilen()

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

143 (f) review all use of `CIbyte *'. Currently this is usually a way of

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

144 passing literal ASCII text strings in places that want internal text.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

145 Either create separate _ascii() and _itext() versions of the

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

146 functions taking CIbyte *, or make use of something like the

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

147 WEXTTEXT() macro, which will generate wide strings as appropriate.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

148 (g) review all uses of Bytecount and see which ones should be Textcount.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

149 (h) put in error-checking code that will be tripped as often as possible

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

150 when doing anything with internal text, and check to see that ASCII

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

151 text has not mistakenly filtered in. This should be fairly easy as

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

152 ASCII text will generally be entirely spaces and letters whereas every

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

153 second byte of Unicode text will generally be a null byte. Either we

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

154 abort if the second bytes are entirely letters and numbers, or,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

155 perhaps better, do the equivalent of a non-MULE build, where we should

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

156 be dealing entirely with 8-bit characters, and assert that the high

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

157 bytes of each pair are null.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

158 (i) review places where xmalloc() is called. If we convert each use of

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

159 xmalloc() to instead be xnew_array() or some other typed routine,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

160 then we will find every place that allocates space for Itext and

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

161 assumes it is based on one-byte units.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

162 (j) encourage the use of ITEXT_ZTERM_SIZE instead of '+ 1' whenever we

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

163 are adding space for a zero-terminator, to emphasize what we are

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

164 doing and make sure the calculations are correct. Similarly for

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

165 EXTTEXT_ZTERM_SIZE.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

166 (k) Note that the qxestr*() functions, among other things, will need to

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

167 be rewritten.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

168

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

169 Note that this is a lot of work, and is not high on the list of priorities

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

170 currently.

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

171

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

172 ==========================================================================

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

173 9. Miscellaneous

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

174 ==========================================================================

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

175

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

176 A. Unicode Support

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

177

1292

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

178 Unicode support is very desirable. Currrently we know how to handle

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

179 externally-encoded Unicode data in various encodings -- UTF-16, UTF-8,

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

180 etc. However, we really need to represent Unicode characters internally

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

181 as-is, rather than converting to some language-specific character set.

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

182 For efficiency, we should represent Unicode characters using 3 bytes

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

183 rather than 4. This means we need to find leading bytes for Unicode.

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

184 Given that there are 65,536 characters in Unicode and we can attach

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

185 96x96 = 9,216 characters per leading byte, we need eight leading bytes

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

186 for Unicode. We currently have four free (0x9A - 0x9D), and with a

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

187 little bit of rearranging we can get five: ASCII doesn't really need to

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

188 take up a leading byte. (We could just as well use 0x7F, with a little

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

189 change to the functions that assume that 0x80 is the lowest leading

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

190 byte.) This means we still need to dump three leading bytes and move

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

191 them into private space. The CNS charsets are good candidates since

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

192 they are rarely used, and JAPANESE_JISX0208_1978 is becoming less and

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

193 less used and could also be dumped.

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

194

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

195 B. Composite Characters

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

196

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

197 Composite characters are characters constructed by overstriking two

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

198 or more regular characters.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

199

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

200 1) The old Mule implementation involves storing composite characters

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

201 in a buffer as a tag followed by all of the actual characters

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

202 used to make up the composite character. I think this is a bad

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

203 idea; it greatly complicates code that wants to handle strings

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

204 one character at a time because it has to deal with the possibility

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

205 of great big ungainly characters. It's much more reasonable to

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

206 simply store an index into a table of composite characters.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

207

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

208 2) The current implementation only allows for 16,384 separate

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

209 composite characters over the lifetime of the XEmacs process.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

210 This could become a potential problem if the user

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

211 edited lots of different files that use composite characters.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

212 Due to FSF bogosity, increasing the number of allowable

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

213 composite characters under Mule would decrease the number

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

214 of possible faces that can exist. Mule already has shrunk

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

215 this to 2048, and further shrinkage would become uncomfortable.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

216 No such problems exist in XEmacs.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

217

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

218 Composite characters could be represented as 0x8D C1 C2 C3,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

219 where each C[1-3] is in the range 0xA0 - 0xFF. This allows

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

220 for slightly under 2^20 (one million) composite characters

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

221 over the XEmacs process lifetime, and you only need to

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

222 increase the size of a Mule character from 19 to 21 bits.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

223 Or you could use 0x8D C1 C2 C3 C4, allowing for about

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

224 85 million (slightly over 2^26) composite characters.

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

225

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

226 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

227 10. Internal API's

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

228 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

229

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

230 All of these are documented in more detail in text.h.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

231

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

232 @enumerate

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

233 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

234 Basic internal-format API's

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

235

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

236 These are simple functions and macros to convert between text

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

237 representation and characters, move forward and back in text, etc.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

238

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

239 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

240 The DFC API

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

241

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

242 This is for conversion between internal and external text. Note that

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

243 there is also the "new DFC" API, which *returns* a pointer to the

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

244 converted text (in alloca space), rather than storing it into a

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

245 variable.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

246

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

247 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

248 The Eistring API

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

249

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

250 (This API is currently under-used) When doing simple things with

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

251 internal text, the basic internal-format API's are enough. But to do

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

252 things like delete or replace a substring, concatenate various strings,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

253 etc. is difficult to do cleanly because of the allocation issues.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

254 The Eistring API is designed to deal with this, and provides a clean

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

255 way of modifying and building up internal text. (Note that the former

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

256 lack of this API has meant that some code uses Lisp strings to do

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

257 similar manipulations, resulting in excess garbage and increased

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

258 garbage collection.)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

259

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

260 NOTE: The Eistring API is (or should be) Mule-correct even without

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

261 an ASCII-compatible internal representation.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

262 @end enumerate

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

263

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

264 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

265 11. Other Sources of Documentation

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

266 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

267

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

268 man/lispref/mule.texi

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

269 @enumerate

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

270 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

271 another intro to characters, encodings, etc; #### Merge with the

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

272 above info

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

273 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

274 documentation of ISO-2022

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

275 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

276 The charset and coding-system Lisp API's

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

277 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

278 The CCL conversion language for writing encoding conversions

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

279 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

280 The Latin-Unity package for unifying Latin charsets

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

281 @end enumerate

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

282

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

283 man/internals/internals.texi (the Internals manual)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

284 @enumerate

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

285 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

286 "Coding for Mule" -- how to write Mule-aware code

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

287 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

288 "Modules for Internationalization"

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

289 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

290 "The Text in a Buffer" -- more about the different ways of

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

291 viewing buffer positions; #### Merge with the above info

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

292 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

293 "MULE Character Sets and Encodings" -- yet another intro

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

294 to characters, encodings, etc; #### Merge with the

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

295 above info; also some documentation of Japanese EUC and JIS7,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

296 and CCL internals

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

297 @end enumerate

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

298

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

299 text.h -- info about specific XEmacs-C API's for handling internal and

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

300 external text

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

301

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

302 intl-win32.c -- Windows-specific I18N information

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

303

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

304 lisp.h -- some info appears alongside the definitions of the basic

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

305 character-related types

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

306

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

307 unicode.c -- documentation about Unicode translation tables

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

308 */

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

309

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

310

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

311 /************************************************************************/

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

312 /* */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

313 /* */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

314 /* Part B: Random proposals for work to be done */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

315 /* */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

316 /* */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

317 /************************************************************************/

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

318

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

319

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

320 /*

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

321

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

322

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

323 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

324 - Mule design issues (ben)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

325 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

326

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

327 circa 1999

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

328

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

329 Here is a more detailed list of Mule-related projects that we will be

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

330 working on. They are more or less ordered according to how we will

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

331 proceed, but it's not exact. In particular, there will probably be

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

332 time overlap among adjacent projects.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

333

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

334 @enumerate

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

335 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

336 Modify the internal/external conversion macros to allow for

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

337 MS Windows support.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

338

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

339 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

340 Modify the buffer macros to allow for more than one internal

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

341 representation, e.g. fixed width and variable width.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

342

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

343 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

344 Review the existing Mule code, especially the lisp code, for code

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

345 quality issues and improve the cleanliness of it. Also work on

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

346 creating a specification for the Mule API.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

347

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

348 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

349 Write some more automated mule tests.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

350

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

351 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

352 Integrate Tomohiko's UTF-2000 code, fixing it up so that nothing is

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

353 broken when the UTF-2000 configure option is not enabled.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

354

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

355 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

356 Fix up the MS Windows code to be Mule-correct, so that you can

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

357 compile with Mule support under MS windows and have a working

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

358 XEmacs, at least just with Latin-1.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

359

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

360 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

361 Implement a scheme to guarantee no corruption of files, even with

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

362 an incorrect coding system - in particular, guarantee no corruption

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

363 of binary files.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

364

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

365 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

366 Make the text property support in XEmacs robust with respect to

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

367 string and text operations, so that the `no corruption' support in

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

368 the previous entry works properly, even if a lot of cutting and

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

369 pasting is done.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

370

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

371 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

372 Improve the handling of auto-detection so that, when there is any

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

373 possibility at all of mistake, the user is informed of the detected

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

374 encoding and given the choice of choosing other possibilities.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

375

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

376 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

377 Improve the support for different language environments in XEmacs,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

378 for example, the priority of coding systems used in auto-detection

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

379 should properly reflect the language environment. This probably

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

380 necessitates rethinking the current `coding system priority'

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

381 scheme.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

382

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

383 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

384 Do quality work to improve the existing UTF-2000 implementation.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

385

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

386 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

387 Implement preliminary support for 8-bit fixed width

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

388 representation. First, we will only implement 7-bit support, and

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

389 will fall back to variable width as soon as any non-ASCII

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

390 character is encountered. Then we will improve the support to

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

391 handle an arbitrary character set in the upper half of the 8-bit space.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

392

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

393 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

394 Investigate any remaining hurdles to making --with-mule be the

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

395 default configure option.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

396 @end enumerate

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

397

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

398 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

399 - Mule design issues (stephen)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

400 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

401

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

402 What I see as Mule priorities (in rough benefit order, I am not taking

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

403 account of difficulty, nor the fact that some - eg 8 & 10 - will

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

404 probably come as packages):

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

405

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

406 @enumerate

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

407 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

408 Fix the autodetect problem (by making the coding priority list

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

409 user-configurable, as short as he likes, even null, with "binary"

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

410 as the default).

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

411 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

412 Document the language environments and other Mule "APIs" as

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

413 implemented (since there is no real design spec). Check to see

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

414 how and where they are broken.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

415 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

416 Make the Mule menu useful to non-ISO-2022-literate folks.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

417 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

418 Redo the lstreams stuff to make it easy and robust to "pipeline",

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

419 eg, libz | gnupg | jis2mule.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

420 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

421 Make Custom Mule-aware. (This probably depends on a sensible

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

422 fonts model.)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

423 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

424 Implement the "literal byte stream" memory feature.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

425 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

426 Study the FSF implementation of Mule for background for 7 & 8.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

427 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

428 Identify desirable Mule features (eg, i18n-ized messages as above,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

429 collating tables by language environment, etc). (New features

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

430 might have priority as high as 9.)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

431 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

432 Specify Mule UIs, APIs, etc, and design and (re)implement them.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

433 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

434 Implement the 8-bit-wide buffer optimization.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

435 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

436 Move the internal encoding to UTF-32 (subject to Olivier's caveats

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

437 regarding compose characters), with the variable-width char

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

438 buffers using UTF-8.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

439 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

440 Implement the 16- and 32-bit-wide buffer optimizations.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

441 @end enumerate

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

442

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

443 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

444 - Mule design issues "short term" (ben)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

445 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

446

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

447 @enumerate

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

448 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

449 Finish changes in fixup/directory, get in CVS.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

450

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

451 (Test with and without "quick-build", to see if really faster)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

452 (need autoconf)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

453

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

454 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

455 Finish up Windows/Mule changes. Outline of this elsewhere; Do

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

456 *minimal* effort.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

457

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

458 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

459 Continue work on Windows stability, e.g. go through existing notes

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

460 on Windows Mule-ization + extract all info.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

461

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

462 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

463 Get Unicode translation tables integrated.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

464

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

465 Finish UCS2/UTF16 coding system.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

466

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

467 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

468 Make sure coding system priority list is language-environment specific.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

469

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

470 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

471 Consider moving language selection Menu up to be parallel with Mule menu.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

472

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

473 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

474 Check to make sure we grok the default locale at startup under

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

475 Windows and understand the Windows locales. Finish implementation

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

476 of mswindows-multibyte and make sure it groks all the locales.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

477

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

478 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

479 Do the above as best as we can without using Unicode tables.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

480

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

481 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

482 Start tagging all text with a language text property,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

483 indicating the current language environment when the text was input.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

484

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

485 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

486 Make sure we correctly accept input of non-ASCII chars

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

487 (probably already do!)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

488

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

489 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

490 Implement active language/keyboard switching under Windows.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

491

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

492 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

493 Look into implementing support for "MS IME" protocol (Microsoft

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

494 fancy built-in Asian input methods).

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

495

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

496 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

497 Redo implementation of mswindows-multibyte and internal display to

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

498 entirely use translation to/from Unicode for increased accuracy.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

499

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

500 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

501 Implement buf<->char improvements from FSF. Also implement

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

502 my string byte<->char optimization structure.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

503

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

504 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

505 Integrate all Mule DOCS from 20.6 or 21.0. Try to add sections

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

506 for what we've added.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

507

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

508 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

509 Implement 8-bit fixed width optimizations. Then work on 16-bit.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

510 @end enumerate

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

511

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

512 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

513 - Mule design issues (more) (ben)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

514 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

515

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

516 Get minimal Mule for Windows working using Ikeyama's patches. At

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

517 first, rely on his conversion of internal -> external

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

518 locale-specific but very soon (as soon as we get translation

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

519 tables) can switch to using Unicode versions of display funs, which

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

520 will allow many more charsets to be handled and in a more

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

521 consistent fashion.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

522

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

523 i.e. to convert an internal string to an external format, at first

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

524 we use our own knowledge of the Microsoft locale file formats but

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

525 an alternative is to convert to Unicode and use Microsoft's

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

526 convert-Unicode-to-locale encoding functions. This gains us a

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

527 great deal of generality, since in practice all charset caching

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

528 points can be wrapped into Unicode caching points.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

529

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

530 This requires adding UCS2 support, which I'm doing. This support

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

531 would let us convert internal -> Unicode, which is exactly what we

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

532 want.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

533

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

534 At first, though, I would do the UCS2 support, but leave the

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

535 existing way of doing things in redisplay. Meanwhile, I'd go

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

536 through and fix up the places in the code that assume we are

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

537 dealing with unibytes.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

538

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

539 After this, the font problems will be fixed , we should have a

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

540 pretty well working XEmacs + MULE under Windows. The only real

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

541 other work is the clipboard code, which should be straightforward.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

542

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

543 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

544 - Mule design discussion

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

545 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

546

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

547 --------------------------------------------------------------------------

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

548

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

549 Ben

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

550

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

551 April 11, 2000

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

552

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

553 Well yes, this was the whole point of my "no lossage" proposal of being

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

554 able to undo any coding-system transformation on a buffer. The idea was

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

555 to figure out which transformations were definitely reversable, and for

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

556 all the others, cache the original text in a text property. This way, you

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

557 could probably still do a fairly good job at constructing a good reversal

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

558 even after you've gone into the text and added, deleted, and rearranged

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

559 some things.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

560

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

561 But you could implement it much more simply and usefully by just

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

562 determining, for any text being decoded into mule-internal, can we go back

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

563 and read the source again? If not, remember the entire file (GNUS

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

564 message, etc) in text properties. Then, implement the UI interface (like

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

565 Netscape's) on top of that. This way, you have something that at least

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

566 works, but it might be inefficient. All we would need to do is work on

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

567 making the

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

568 underlying implementation more efficient.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

569

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

570 Are you interested in doing this? It would be a huge win for users.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

571 Hrvoje Niksic wrote:

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

572

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

573 > Ben Wing <ben@666.com> writes:

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

574 >

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

575 > > let me know exactly what "rethink" functionality you want and i'll

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

576 > > come up with an interface. perhaps you just want something like

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

577 > > netscape's encoding menu, where if you switch encodings, it reloads

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

578 > > and reencodes?

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

579 >

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

580 > It might be a bit more complex than that. In many cases, it's hard or

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

581 > impossible to meaningfully "reload" -- for instance, this

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

582 > functionality should be available while editing a Gnus message, as

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

583 > well as while visiting a file.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

584 >

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

585 > For the special case of Latin-N <-> Latin-M conversion, things could

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

586 > be done easily -- to convert from N to M, you only need to convert

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

587 > internal representation back to N, and then convert it forth to M.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

588

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

589 --------------------------------------------------------------------------

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

590 April 11, 2000

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

591

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

592 Well yes, this was the whole point of my "no lossage" proposal of being

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

593 able to undo any coding-system transformation on a buffer. The idea was

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

594 to figure out which transformations were definitely reversable, and for

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

595 all the others, cache the original text in a text property. This way, you

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

596 could probably still do a fairly good job at constructing a good reversal

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

597 even after you've gone into the text and added, deleted, and rearranged

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

598 some things.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

599

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

600 But you could implement it much more simply and usefully by just

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

601 determining, for any text being decoded into mule-internal, can we go back

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

602 and read the source again? If not, remember the entire file (GNUS

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

603 message, etc) in text properties. Then, implement the UI interface (like

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

604 Netscape's) on top of that. This way, you have something that at least

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

605 works, but it might be inefficient. All we would need to do is work on

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

606 making the

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

607 underlying implementation more efficient.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

608

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

609 Are you interested in doing this? It would be a huge win for users.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

610 Hrvoje Niksic wrote:

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

611

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

612 > Ben Wing <ben@666.com> writes:

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

613 >

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

614 > > let me know exactly what "rethink" functionality you want and i'll

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

615 > > come up with an interface. perhaps you just want something like

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

616 > > netscape's encoding menu, where if you switch encodings, it reloads

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

617 > > and reencodes?

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

618 >

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

619 > It might be a bit more complex than that. In many cases, it's hard or

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

620 > impossible to meaningfully "reload" -- for instance, this

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

621 > functionality should be available while editing a Gnus message, as

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

622 > well as while visiting a file.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

623 >

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

624 > For the special case of Latin-N <-> Latin-M conversion, things could

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

625 > be done easily -- to convert from N to M, you only need to convert

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

626 > internal representation back to N, and then convert it forth to M.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

627

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

628

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

629 ------------------------------------------------------------------------

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

630

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

631 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

632 - Redoing translation macros [old]

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

633 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

634

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

635 Currently the translation macros (the macros with names such as

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

636 GET_C_STRING_CTEXT_DATA_ALLOCA) have names that are difficult to parse

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

637 or remember, and are not all that general. In the process of

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

638 reviewing the Windows code so that it could be muleized, I discovered

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

639 that these macros need to be extended in various ways to allow for

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

640 the Windows code to be easily muleized.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

641

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

642 Since the macros needed to be changed anyways, I figured it would be a

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

643 good time to redo them properly. I propose new macros which have

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

644 names like this:

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

645

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

646 @itemize @bullet

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

647 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

648 <A>_TO_EXTERNAL_FORMAT_<B>

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

649 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

650 <A>_TO_EXTERNAL_FORMAT_<B>_1

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

651 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

652 <C>_TO_INTERNAL_FORMAT_<D>

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

653 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

654 <C>_TO_INTERNAL_FORMAT_<D>_1

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

655 @end itemize

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

656

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

657 A and C represent the source of the data, and B and D represent the

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

658 sink of the data.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

659

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

660 All of these macros call either the functions

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

661 convert_to_external_format or convert_to_internal_format internally,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

662 with some massaging of the arguments.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

663

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

664 All of these macros take the following arguments:

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

665

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

666 @itemize @bullet

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

667 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

668 First, one or two arguments indicating the source of the data.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

669 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

670 Second, an argument indicating the coding system. (In order to avoid

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

671 an excessive number of macros, we no longer provide separate macros

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

672 for specific coding systems.)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

673 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

674 Third, one or two arguments indicating the sink of the data.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

675 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

676 Fourth, optionally, arguments indicating the error behavior and the

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

677 warning class (these arguments are only present in the _1 versions

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

678 of the macros). The other, shorter named macros are trivial

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

679 interfaces onto these macros with the error behavior being

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

680 ERROR_ME_WARN, with the warning class being Vstandard_warning_class.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

681 @end itemize

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

682

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

683 <A> can be one of the following:

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

684 @itemize @bullet

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

685 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

686 LISP (which means a Lisp string) Takes one argument, a Lisp Object.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

687 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

688 LSTREAM (which indicates an lstream) Takes one argument, an

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

689 lstream. The data is read from the lstream until EOF is reached.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

690 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

691 DATA (which indicates a raw memory area) Takes two arguments, a

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

692 pointer and a length in bytes.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

693 (You must never use this if the source of the data is a Lisp string,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

694 because of the possibility of relocation during garbage collection.)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

695 @end itemize

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

696

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

697 <B> can be one of the following:

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

698 @itemize @bullet

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

699 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

700 ALLOCA (which means that the resulting data is stored in alloca()ed

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

701 memory. Two arguments should be specified, a pointer and a length,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

702 which should be lvalues.)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

703 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

704 MALLOC (which means that the resulting data is stored in malloc()ed

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

705 memory. Two arguments should be specified, a pointer and a

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

706 length. The memory must be free()d by the caller.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

707 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

708 OPAQUE (which means the resulting data is stored in an opaque Lisp

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

709 Object. This takes one argument, a lvalue Lisp Object.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

710 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

711 LSTREAM. The data is written to an lstream.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

712 @end itemize

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

713

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

714 <C> can be one of the :

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

715 @itemize @bullet

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

716 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

717 DATA

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

718 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

719 LSTREAM

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

720 @end itemize

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

721 (just like <A> above)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

722

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

723 <D> can be one of

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

724 @itemize @bullet

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

725 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

726 ALLOCA

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

727 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

728 MALLOC

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

729 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

730 LISP This means a Lisp String.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

731 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

732 BUFFER The resulting data is inserted into a buffer at the buffer's

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

733 value of point.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

734 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

735 LSTREAM The data is written to the lstream.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

736 @end itemize

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

737

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

738

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

739 Note that I have eliminated the FORMAT argument of previous macros,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

740 and replaced it with a coding system. This was made possible by

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

741 coding system aliases. In place of old `format's, we use a `virtual

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

742 coding system', which is aliased to the actual coding system.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

743

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

744 The value of the coding system argument can be anything that is legal

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

745 input to get_coding_system, i.e. a symbol or a coding system object.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

746

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

747 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

748 - creation of generic macros for accessing internally formatted data [old]

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

749 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

750

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

751 I have a design; it's all written down (I did it in Tsukuba), and I just have

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

752 to have it transcribed. It's higher level than the macros, though; it's Lisp

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

753 primitives that I'm designing.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

754

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

755 As for the design of the macros, don't worry so much about all files having to

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

756 get included (which is inevitable with macros), but about how the files are

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

757 separated. Your design might go like this:

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

758

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

759 @enumerate

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

760 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

761 you have generic macro interfaces, which specify a particular

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

762 behavior but not an implementation. these generic macros have

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

763 complementary versions for buffers and for strings (and the buffer

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

764 or string is an argument to all of the macros), and do such things

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

765 as convert between byte and char indices, retrieve the character at

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

766 a particular byte or char index, increment or decrement a byte

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

767 index to the beginning of the next or previous character, indicate

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

768 the number of bytes occupied by the character at a particular byte

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

769 or character index, etc. These are similar to what's already out

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

770 there except that they confound buffers and strings and that they

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

771 can also work with actual char *'s, which I think is a really bad

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

772 idea because it encourages code to "assume" that the representation

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

773 is ASCII compatible, which is might not be (e.g. 16-bit fixed

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

774 width). In fact, one thing I'm planning on doing is redefining

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

775 Bufbyte as a struct, for debugging purposes, to catch all places

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

776 that cavalierly compare them with ASCII char's. Note also that I

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

777 really want to rename Bufpos and Bytind, which are confusing and

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

778 wrong in that they also apply to strings. They should be Bytepos

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

779 and Charpos, or something like that, to go along with Bytecount and

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

780 Charcount. Similarly, Bufbyte is similarly a misnomer and should be

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

781 Intbyte -- a byte in the internal string representation (any of the

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

782 internal representations) of a string or buffer. Corresponding to

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

783 this is Extbyte (which we already have), a byte in any external

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

784 string representation. We also have Extcount, which makes sense,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

785 and we might possibly want Extcharcount, the number of characters

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

786 in an external string representation; but that gets sticky in modal

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

787 encodings, and it's not clear how useful it would be.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

788

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

789 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

790 for all generic macro interfaces, there are specific versions of

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

791 each of them for each possible representation (pure ASCII in the

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

792 non-Mule world, Mule standard, UTF-8, 8-bit fixed, 16-bit fixed,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

793 32-bit fixed, etc.; there may well be more than one possible 16-bit

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

794 fixed version, as well). Each representation has a corresponding

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

795 prefix, e.g. MULE_ or FIXED16_ or whatever, which is prefixed onto

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

796 the generic macro names. The resulting macros perform the

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

797 operation defined for the macro, but assume, and only work

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

798 correctly with, text in the corresponding representation.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

799

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

800 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

801 The definition of the generic versions merely conditionalizes on

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

802 the appropriate things (i.e. bit flags in the buffer or string

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

803 object) and calls the appropriate representation-specific version.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

804 There may be more than one definition (protected by ifdefs, of

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

805 course), or one definition that amalgamated out of many ifdef'ed

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

806 sections.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

807

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

808 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

809 You should probably put each different representation in its own

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

810 header file, e.g. charset-mule.h or charset-fixed16.h or

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

811 charset-ascii.h or whatever. Then put the main macros into

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

812 charset.h, and conditionalize in this file appropriately to include

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

813 the other ones. That way, code that actually needs to play around

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

814 with internal-format text at this level can include "charset.h"

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

815 (certainly a much better place than buffer.h), and everyone else

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

816 uses higher-level routines. The representation-specific macros

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

817 should not normally be used *directly* at all; they are invoked

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

818 automatically from the generic macros. However, code that needs to

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

819 be highly, highly optimized might choose to take a loop and write

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

820 two versions of it, one for each representation, to avoid the

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

821 per-loop-iteration cost of a comparison. Until the macro interface

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

822 is rock stable and solid, we should strongly discourage such

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

823 nanosecond optimizations.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

824 @end enumerate

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

825

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

826 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

827 - UTF-16 compatible representation

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

828 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

829

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

830 NOTE: One possible default internal representation that was compatible

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

831 with UTF16 but allowed all possible chars in UCS4 would be to take a

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

832 more-or-less unused range of 2048 chars (not from the private area

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

833 because Microsoft actually uses up most or all of it with EUDC chars).

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

834 Let's say we picked A400 - ABFF. Then, we'd have:

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

835

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

836 0000 - FFFF Simple chars

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

837

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

838 D[8-B]xx D[C-F]xx Surrogate char, represents 1M chars

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

839

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

840 A[4-B]xx D[C-F]xx D[C-F]xx Surrogate char, represents 2G chars

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

841

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

842 This is exactly the same number of chars as UCS-4 handles, and it follows the

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

843 same property as UTF8 and Mule-internal:

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

844

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

845 @enumerate

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

846 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

847 There are two disjoint groupings of units, one representing leading units

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

848 and one representing non-leading units.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

849 @item

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

850 Given a leading unit, you immediately know how many units follow to make

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

851 up a valid char, irrespective of any other context.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

852 @end enumerate

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

853

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

854 Note that A4xx is actually currently assigned to Yi. Since this is an

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

855 internal representation, we could just move these elsewhere.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

856

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

857 An alternative is to pick two disjoint ranges, e.g. 2D00 - 2DFF and

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

858 A500 - ABFF.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

859

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

860 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

861 New API for char->font mapping

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

862 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

863 - ; supersedes charset-registry and CCL;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

864 supports all windows systems; powerful enough for Unicode; etc.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

865

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

866 (charset-font-mapping charset)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

867

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

868 font-mapping-specifier string

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

869

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

870 char-font-mapping-table

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

871

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

872 char-table, specifier; elements of char table are either strings (which

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

873 specify a registry or comparable font property, or vectors of a string

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

874 (same) followed by keyword-value pairs (optional). The only allowable

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

875 keyword currently is :ccl-program, which specifies a CCL program to map

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

876 the characters into font indices. Other keywords may be added

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

877 e.g. allowing Elisp fragments instead of CCL programs, also allowed is

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

878 [inherit], which inherits from the next less-specific char-table in the

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

879 specifier.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

880

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

881 The preferred interface onto this mapping (which should be portable

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

882 across Emacsen) is

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

883

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

884 (set-char-font-mapping key value &optional locale tag-set how-to-add)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

885

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

886 where key is a char, range or charset (as for put-char-table), value is

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

887 as above, and the other arguments are standard for specifiers. This

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

888 automatically creates a char table in the locale, as necessary (all

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

889 elements default to [inherit]). On GNU Emacs, some specifiers arguments

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

890 may be unimplemented.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

891

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

892 (char-font-mapping key value &optional locale)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

893 works vaguely like get-specifier? But does inheritance processing.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

894 locale should clearly default here to current-buffer

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

895

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

896 #### should get-specifier as well? Would make it work most like

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

897 #### buffer-local variables.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

898

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

899 NB. set-charset-registry and set-charset-ccl-program are obsoleted.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

900

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

901 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

902 Implementing fixed-width 8,16,32 bit buffer optimizations

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

903 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

904

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

905 Add set-buffer-optimization (buffer &rest keywords) for

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

906 controlling these things.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

907

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

908 Also, put in hack so that correct arglist can be retrieved by

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

909 Lisp code.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

910

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

911 Look at the way keyword primitives are currently handled; make

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

912 sure it works and is documented, etc.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

913

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

914 Implement 8-bit fixed width optimization. Take the things that

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

915 know about the actual implementation and put them in a single

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

916 file, in essence creating an abstraction layer to allow

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

917 pluggable internal representations. Implement a fairly general

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

918 scheme for mapping between character codes in the 8 bits or 16

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

919 bits representation and on actual charset characters. As part of

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

920 set-buffer-optimization, you can specify a list of character sets

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

921 to be used in the 8 bit to 16 bit, etc. world. You can also

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

922 request that the buffer be in 8, 16, etc. if possible.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

923

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

924 -> set defaults wrt this.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

925 -> perhaps this should be just buffer properties.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

926 -> this brings up the idea of default properties on an object.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

927 -> Implement default-put, default-get, etc.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

928

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

929 What happens when a character not assigned in the range gets

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

930 added? Then, must convert to variable width of some sort.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

931

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

932 Note: at first, possibly we just convert whole hog to get things

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

933 right. Then we'd have to poy alternative to characters that got

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

934 added + deleted that were unassigned in the fixed width. When

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

935 this goes to zero and there's been enough time (heuristics), we

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

936 go back to fixed.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

937

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

938 Side note: We could dynamically build up the set of assigned

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

939 chars as they go. Conceivably this could even go down to the

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

940 single char level: Just keep a big array of mapping from 16 bit

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

941 values to chars, and add empty time, a char has been encountered

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

942 that wasn't there before. Problem need inverse mapping.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

943

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

944 -> Possibility; chars are actual objects, not just numbers.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

945 Then you could keep track of such info in the chars itself.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

946 *Think about this.*

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

947

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

948 Eventually, we might consider allowing mixed fixed-width,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

949 variable-width buffer encodings. Then, we use range tables to

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

950 indicate which sections are fixed and which variable and INC_CHAR does

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

951 something like this: binary search to find the current range, which

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

952 indicates whether it's fixed or variable, and tells us what the

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

953 increment is. We can cache this info and use it next time to speed

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

954 up.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

955

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

956 -> We will then have two partially shared range tables - one for

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

957 overall fixed width vs. variable width, and possibly one containing

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

958 this same info, but partitioning the variable width in one. Maybe

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

959 need fancier nested range table model.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

960

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

961 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

962 Expansion of display table and case mapping table support for all

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

963 chars, not just ASCII/Latin1.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

964 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

965

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

966 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

967 Improved flexibility for display tables, and evaluation of its

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

968 features to make sure it meshes with and complements the char<->font

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

969 mapping API mentioned earlier

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

970 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

971

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

972 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

973 String access speedup:

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

974 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

975

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

976 For strings larger than some size in bytes (10?), keep extra fields of

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

977 info: length in chars, and a (char, byte) pair in the middle to speed

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

978 up sequential access.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

979

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

980 (Better idea: do this for any size string, but only if it contains

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

981 non-ASCII chars. Then if info is missing, we know string is

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

982 ASCII-only.)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

983

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

984 Use a string-extra-info object, replacing string property slot and

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

985 containing fields for string mod tick, string extents, string props,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

986 and string char length, and cached (char,byte) pair.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

987 string-extra-info (or string-auxiliary?) objects could be in frob

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

988 blocks, esp. if creating frob blocks is easy + worth it.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

989

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

990 - Caching of char<->byte conversions in strings - should make nearly

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

991 all operations on strings O(N)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

992

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

993 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

994 Improvements in buffer char<->byte mapping

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

995 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

996

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

997 - Range table implementation - especially when there are few runs of

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

998 different widths, e.g. recently converted from fixed-width

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

999 optimization to variable width

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1000

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1001 Range Tables to speed up Bufpos <-> Bytind caching

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1002 ==================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1003

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1004 This describes an alternative implementation using ranges. We

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1005 maintain a range table of all spans of characters of a fixed width.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1006 Updating this table could take time if there are a large number of

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1007 spans; but constant factors of operations should be quick. This method really wins

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1008 when you have 8-bit buffers just converted to variable width, where

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1009 there will be few spans. More specifically, lookup in this range

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1010 table is O(log N) and can be done with simple binary search, which is

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1011 very fast. If we maintain the ranges using a gap array, updating this

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1012 table will be fast for local operations, which is most of the time.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1013

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1014 We will also provide (at first, at least) a Lisp function to set the

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1015 caching mechanism explicitly - either range tables or the existing

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1016 implementation. Eventually, we want to improve things, to the point

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1017 where we automatically pick the right caching for the situation and

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1018 have more caching schemes implemented.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1019

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1020 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1021 - Robustify Text Properties

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1022 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1023

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1024 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1025 Support for unified internal representation, e.g. Unicode

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1026 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1027

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1028 Start tagging all text with a language text property,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1029 indicating the current language environment when the text was input.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1030 (needs "Robustify Text Properties")

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1031

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1032 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1033 - Generalized Coding Systems

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1034 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1035

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1036 - Lisp API for Defining Coding Systems

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1037

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1038 User-defined coding systems.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1039

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1040 (define-coding-system-type 'type

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1041 :encode-function fun

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1042 :decode-function fun

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1043 :detect-function fun

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1044 :buffering (number = at least this many chars

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1045 line = buffer up to end of line

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1046 regexp = buffer until this regexp is found in match

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1047 source data. match data will be appropriate when fun is

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1048 called

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1049

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1050 encode fun is called as

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1051

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1052 (encode instream outstream)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1053

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1054 should read data from instream and write converted result onto

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1055 outstream. Can leave some data stuff in stream, it will reappear

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1056 next time. Generally, there is a finite amount of data in instream

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1057 and further attempts to read lead to would-block errors or retvals.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1058 Can use instream properties to record state. May use read-stream

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1059 functionality to read everything into a vector or string.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1060

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1061 ->Need vectors + string exposed to resizing of Lisp implementation

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1062 where necessary.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1063

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1064 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1065 Support Windows Active Kbd Switching, Far East IME API (done already?)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1066 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1067

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1068 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1069 - UI/design changes for Coding System Pipelining

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1070 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1071

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1072 ------------------------------------------------------------------

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1073 CODING-SYSTEM CHAINS

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1074 ------------------------------------------------------------------

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1075

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1076 sjt sez:

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1077

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1078 There should be no elementary coding systems in the Lisp API, only

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1079 chains. Chains should be declared, not computed, as a sequence of coding

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1080 formats. (Probably the internal representation can be a vector for

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1081 efficiency but programmers would probably rather work with lists.) A

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1082 stream has a token type. Most streams are octet streams. Text is a

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1083 stream of characters (in _internal_ format; a file on disk is not text!)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1084 An octet-stream has no implicit semantics, so its format must always be

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1085 specified. The only type currently having semantics is characters. This

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1086 means that the chain [euc-jp -> internal -> shift_jis) may be specified

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1087 (euc-jp, shift_jis), and if no euc-jp -> shift_jis converter is

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1088 available, then the chain is automatically constructed. (N.B. I f we

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1089 have fixed width buffers in the future, then we could have ASCII -> 8-bit

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1090 char -> 16-bit char -> ISO-2022-JP (with escape sequences).

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1091

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1092 EOL handling is a char <-> char coding. It should not be part of another

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1093 coding system except as a convenience for users. For text coding,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1094 automatically insert EOL handlers between char <-> octet boundaries.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1095

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1096 ------------------------------------------------------------------

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1097 ABOUT DETECTION

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1098 ------------------------------------------------------------------

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1099

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1100

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1101 ------------------------------------------------------------------

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1102 EFFICIENCY OF CODING CONVERSION WITH MULTIPLE COPIES/CHAINS

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1103 ------------------------------------------------------------------

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1104

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1105 A comment in encode_decode_coding_region():

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1106

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1107 The chain of streams looks like this:

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1108

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1109 [BUFFER] <----- (( read from/send to loop ))

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1110 ------> [CHAR->BYTE i.e. ENCODE AS BINARY if source is

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1111 in bytes]

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1112 ------> [ENCODE/DECODE AS SPECIFIED]

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1113 ------> [BYTE->CHAR i.e. DECODE AS BINARY

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1114 if sink is in bytes]

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1115 ------> [AUTODETECT EOL if

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1116 we're decoding and

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1117 coding system calls

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1118 for this]

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1119 ------> [BUFFER]

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1120

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1121 sjt (?) responds:

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1122

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1123 Of course, this is just horrible. BYTE<->CHAR should only be available

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1124 to I/O routines. It should not be visible to Mule proper.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1125

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1126 A comment on the implementation. Hrvoje and Kyle worry about the

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1127 inefficiency of repeated copying among buffers that chained coding

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1128 systems entail. But this may not be as time inefficient as it appears

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1129 in the Mule ("house rules") context. The issue is how do you do chain

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1130 coding systems without copying? In theory you could have

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1131

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1132 IChar external_to_raw (ExtChar *cp, State *s);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1133 IChar decode_utf16 (IChar c, State *s);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1134 IChar decode_crlf (ExtChar *cp, State *s);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1135

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1136 typedef Ichar (*Converter[]) (Ichar, State*);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1137

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1138 Converter utf16[2] = { &decode_utf16, &decode_crlf };

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1139

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1140 void convert (ExtChar *inbuf, IChar *outbuf, Converter cvtr)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1141 {

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1142 int i;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1143 ExtChar c;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1144 State s;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1145

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1146 while (c = external_to_raw (*inbuf++, &s))

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1147 {

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1148 for (i = 0; i < sizeof(cvtr)/sizeof(Converter); ++i)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1149 if (s.ready)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1150 c = (*cvtr[i]) (c, &s);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1151 }

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1152 if (s.ready)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1153 *outbuf++ = c;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1154 }

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1155

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1156 But this is a lot of function calls; what Ben is doing is basically

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1157 reducing this to one call per buffer-full. The only way to avoid this

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1158 is to hardcode all the "interesting" coding systems, maybe using

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1159 inline or macros to give structure. But this is still a huge amount

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1160 of work, and code.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1161

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1162 One advantage to the call-per-char approach is that we might be able

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1163 to do something about the marker/extent destruction that coding

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1164 normally entails.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1165

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1166 ben sez:

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1167

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1168 it should be possible to preserve the markers/extents without

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1169 switching completely to one-call-per-char -- we could at least do one

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1170 call per "run", where a run is more or less the maximal stretch of

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1171 text not overlapping any markers or extent boundaries. (It's a bit

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1172 more complicated if we want to properly support the different extent

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1173 begins/ends; in some cases we might have to pump a single character

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1174 adjacent to where two extents meet.) The "stateless" way that I wrote

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1175 all of the conversion routines may be a real hassle but it allows

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1176 something like this to work without too much problem -- pump in one

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1177 run at a time into one end of the chain, do a flush after each

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1178 iteration, and stick what comes out the other end in its place.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1179

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1180 ------------------------------------------------------------------

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1181 ABOUT FORMATS

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1182 ------------------------------------------------------------------

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1183

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1184 when calling make-coding-system, the name can be a cons of (format1 .

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1185 format2), specifying that it decodes format1->format2 and encodes the other

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1186 way. if only one name is given, that is assumed to be format1, and the

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1187 other is either `external' or `internal' depending on the end type.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1188 normally the user when decoding gives the decoding order in formats, but

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1189 can leave off the last one, `internal', which is assumed. a multichain

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1190 might look like gzip|multibyte|unicode, using the coding systems named

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1191 `gzip', `(unicode . multibyte)' and `unicode'. the way this actually works

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1192 is by searching for gzip->multibyte; if not found, look for gzip->external

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1193 or gzip->internal. (In general we automatically do conversion between

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1194 internal and external as necessary: thus gzip|crlf does the expected, and

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1195 maps to gzip->external, external->internal, crlf->internal, which when

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1196 fully specified would be gzip|external:external|internal:crlf|internal --

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1197 see below.) To forcibly fit together two converters that have explicitly

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1198 specified and incompatible names (say you have unicode->multibyte and

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1199 iso8859-1->ebcdic and you know that the multibyte and iso8859-1 in this

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1200 case are compatible), you can force-cast using :, like this:

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1201 ebcdic|iso8859-1:multibyte|unicode. (again, if you force-cast between

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1202 internal and external formats, the conversion happens automatically.)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1203

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1204 --------------------------------------------------------------------------

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1205 ABOUT PDUMP, UNICODE, AND RUNNING XEMACS FROM A DIRECTORY WITH WEIRD CHARS

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1206 --------------------------------------------------------------------------

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1207

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1208 -- there's the problem that XEmacs can't be run in a directory with

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1209 non-ASCII/Latin-1 chars in it, since it will be doing Unicode

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1210 processing before we've had a chance to load the tables. In fact,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1211 even finding the tables in such a situation is problematic using

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1212 the normal commands. my idea is to eventually load the stuff

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1213 extremely extremely early, at the same time as the pdump data gets

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1214 loaded. in fact, the unicode table data (stored in an efficient

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1215 binary format) can even be stuck into the pdump file (which would

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1216 mean as a resource to the executable, for windows). we'd need to

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1217 extend pdump a bit: to allow for attaching extra data to the pdump

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1218 file. (something like pdump_attach_extra_data (addr, length)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1219 returns a number of some sort, an index into the file, which you

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1220 can then retrieve with pdump_load_extra_data(), which returns an

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1221 addr (mmap()ed or loaded), and later you pdump_unload_extra_data()

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1222 when finished. we'd probably also need

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1223 pdump_attach_extra_data_append(), which appends data to the data

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1224 just written out with pdump_attach_extra_data(). this way,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1225 multiple tables in memory can be written out into one contiguous

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1226 table. (we'd use the tar-like trick of allowing new blocks to be

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1227 written without going back to change the old blocks -- we just rely

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1228 on the end of file/end of memory.) this same mechanism could be

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1229 extracted out of pdump and used to handle the non-pdump situation

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1230 (or alternatively, we could just dump either the memory image of

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1231 the tables themselves or the compressed binary version). in the

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1232 case of extra unicode tables not known about at compile time that

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1233 get loaded before dumping, we either just dump them into the image

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1234 (pdump and all) or extract them into the compressed binary format,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1235 free the original tables, and treat them like all other tables.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1236

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1237

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1238 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1239 - Generalized language appropriate word wrapping (requires

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1240 layout-exposing API defined in BIDI section)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1241 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1242

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1243 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1244 - Make Custom Mule-aware

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1245 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1246

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1247 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1248 - Composite character support

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1249 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1250

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1251 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1252 - Language appropriate sorting and searching

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1253 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1254

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1255 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1256 - Glyph shaping for Arabic and Devanagari

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1257 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1258

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1259 - (needs to be handled mostly

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1260 at C level, as part of layout; luckily it's entirely local in its

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1261 changes, as this is not hard)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1262

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1263

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1264 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1265 Consider moving language selection Menu up to be parallel with Mule menu

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1266 ==========================================================================

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1267

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1268 */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1269

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1270

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1271

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1272 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1273 /* declarations */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1274 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1275

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1276 Eistring the_eistring_zero_init, the_eistring_malloc_zero_init;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1277

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1278 #define MAX_CHARBPOS_GAP_SIZE_3 (65535/3)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1279 #define MAX_BYTEBPOS_GAP_SIZE_3 (3 * MAX_CHARBPOS_GAP_SIZE_3)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1280

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1281 short three_to_one_table[1 + MAX_BYTEBPOS_GAP_SIZE_3];

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1282

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1283 #ifdef MULE

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1284

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1285 /* Table of number of bytes in the string representation of a character

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1286 indexed by the first byte of that representation.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1287

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1288 rep_bytes_by_first_byte(c) is more efficient than the equivalent

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1289 canonical computation:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1290

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1291 XCHARSET_REP_BYTES (charset_by_leading_byte (c)) */

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1292

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1293 const Bytecount rep_bytes_by_first_byte[0xA0] =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1294 { /* 0x00 - 0x7f are for straight ASCII */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1295 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1296 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1297 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1298 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1299 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1300 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1301 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1302 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1303 /* 0x80 - 0x8f are for Dimension-1 official charsets */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1304 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1305 /* 0x90 - 0x9d are for Dimension-2 official charsets */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1306 /* 0x9e is for Dimension-1 private charsets */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1307 /* 0x9f is for Dimension-2 private charsets */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1308 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 4

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1309 };

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1310

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1311 #ifdef ENABLE_COMPOSITE_CHARS

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1312

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1313 /* Hash tables for composite chars. One maps string representing

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1314 composed chars to their equivalent chars; one goes the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1315 other way. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1316 Lisp_Object Vcomposite_char_char2string_hash_table;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1317 Lisp_Object Vcomposite_char_string2char_hash_table;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1318

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1319 static int composite_char_row_next;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1320 static int composite_char_col_next;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1321

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1322 #endif /* ENABLE_COMPOSITE_CHARS */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1323

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1324 #endif /* MULE */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1325

1292

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

1326 Lisp_Object QSin_char_byte_conversion;

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

1327 Lisp_Object QSin_internal_external_conversion;

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

1328

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1329

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1330 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1331 /* qxestr***() functions */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1332 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1333

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1334 /* Most are inline functions in lisp.h */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1335

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1336 int

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1337 qxesprintf (Ibyte *buffer, const CIbyte *format, ...)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1338 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1339 va_list args;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1340 int retval;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1341

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1342 va_start (args, format);

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1343 retval = vsprintf ((Chbyte *) buffer, format, args);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1344 va_end (args);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1345

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1346 return retval;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1347 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1348

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1349 /* strcasecmp() implementation from BSD */

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1350 static Ibyte strcasecmp_charmap[] = {

1429

969b7290edca [xemacs-hg @ 2003-04-24 05:33:43 by youngs]

youngs

parents: 1318

diff changeset

1351 0000, 0001, 0002, 0003, 0004, 0005, 0006, 0007,

969b7290edca [xemacs-hg @ 2003-04-24 05:33:43 by youngs]

youngs

parents: 1318

diff changeset

1352 0010, 0011, 0012, 0013, 0014, 0015, 0016, 0017,

969b7290edca [xemacs-hg @ 2003-04-24 05:33:43 by youngs]

youngs

parents: 1318

diff changeset

1353 0020, 0021, 0022, 0023, 0024, 0025, 0026, 0027,

969b7290edca [xemacs-hg @ 2003-04-24 05:33:43 by youngs]

youngs

parents: 1318

diff changeset

1354 0030, 0031, 0032, 0033, 0034, 0035, 0036, 0037,

969b7290edca [xemacs-hg @ 2003-04-24 05:33:43 by youngs]

youngs

parents: 1318

diff changeset

1355 0040, 0041, 0042, 0043, 0044, 0045, 0046, 0047,

969b7290edca [xemacs-hg @ 2003-04-24 05:33:43 by youngs]

youngs

parents: 1318

diff changeset

1356 0050, 0051, 0052, 0053, 0054, 0055, 0056, 0057,

969b7290edca [xemacs-hg @ 2003-04-24 05:33:43 by youngs]

youngs

parents: 1318

diff changeset

1357 0060, 0061, 0062, 0063, 0064, 0065, 0066, 0067,

969b7290edca [xemacs-hg @ 2003-04-24 05:33:43 by youngs]

youngs

parents: 1318

diff changeset

1358 0070, 0071, 0072, 0073, 0074, 0075, 0076, 0077,

969b7290edca [xemacs-hg @ 2003-04-24 05:33:43 by youngs]

youngs

parents: 1318

diff changeset

1359 0100, 0141, 0142, 0143, 0144, 0145, 0146, 0147,

969b7290edca [xemacs-hg @ 2003-04-24 05:33:43 by youngs]

youngs

parents: 1318

diff changeset

1360 0150, 0151, 0152, 0153, 0154, 0155, 0156, 0157,

969b7290edca [xemacs-hg @ 2003-04-24 05:33:43 by youngs]

youngs

parents: 1318

diff changeset

1361 0160, 0161, 0162, 0163, 0164, 0165, 0166, 0167,

969b7290edca [xemacs-hg @ 2003-04-24 05:33:43 by youngs]

youngs

parents: 1318

diff changeset

1362 0170, 0171, 0172, 0133, 0134, 0135, 0136, 0137,

969b7290edca [xemacs-hg @ 2003-04-24 05:33:43 by youngs]

youngs

parents: 1318

diff changeset

1363 0140, 0141, 0142, 0143, 0144, 0145, 0146, 0147,

969b7290edca [xemacs-hg @ 2003-04-24 05:33:43 by youngs]

youngs

parents: 1318

diff changeset

1364 0150, 0151, 0152, 0153, 0154, 0155, 0156, 0157,

969b7290edca [xemacs-hg @ 2003-04-24 05:33:43 by youngs]

youngs

parents: 1318

diff changeset

1365 0160, 0161, 0162, 0163, 0164, 0165, 0166, 0167,

969b7290edca [xemacs-hg @ 2003-04-24 05:33:43 by youngs]

youngs

parents: 1318

diff changeset

1366 0170, 0171, 0172, 0173, 0174, 0175, 0176, 0177,

969b7290edca [xemacs-hg @ 2003-04-24 05:33:43 by youngs]

youngs

parents: 1318

diff changeset

1367 0200, 0201, 0202, 0203, 0204, 0205, 0206, 0207,

969b7290edca [xemacs-hg @ 2003-04-24 05:33:43 by youngs]

youngs

parents: 1318

diff changeset

1368 0210, 0211, 0212, 0213, 0214, 0215, 0216, 0217,

969b7290edca [xemacs-hg @ 2003-04-24 05:33:43 by youngs]

youngs

parents: 1318

diff changeset

1369 0220, 0221, 0222, 0223, 0224, 0225, 0226, 0227,

969b7290edca [xemacs-hg @ 2003-04-24 05:33:43 by youngs]

youngs

parents: 1318

diff changeset

1370 0230, 0231, 0232, 0233, 0234, 0235, 0236, 0237,

969b7290edca [xemacs-hg @ 2003-04-24 05:33:43 by youngs]

youngs

parents: 1318

diff changeset

1371 0240, 0241, 0242, 0243, 0244, 0245, 0246, 0247,

969b7290edca [xemacs-hg @ 2003-04-24 05:33:43 by youngs]

youngs

parents: 1318

diff changeset

1372 0250, 0251, 0252, 0253, 0254, 0255, 0256, 0257,

969b7290edca [xemacs-hg @ 2003-04-24 05:33:43 by youngs]

youngs

parents: 1318

diff changeset

1373 0260, 0261, 0262, 0263, 0264, 0265, 0266, 0267,

969b7290edca [xemacs-hg @ 2003-04-24 05:33:43 by youngs]

youngs

parents: 1318

diff changeset

1374 0270, 0271, 0272, 0273, 0274, 0275, 0276, 0277,

969b7290edca [xemacs-hg @ 2003-04-24 05:33:43 by youngs]

youngs

parents: 1318

diff changeset

1375 0300, 0301, 0302, 0303, 0304, 0305, 0306, 0307,

969b7290edca [xemacs-hg @ 2003-04-24 05:33:43 by youngs]

youngs

parents: 1318

diff changeset

1376 0310, 0311, 0312, 0313, 0314, 0315, 0316, 0317,

969b7290edca [xemacs-hg @ 2003-04-24 05:33:43 by youngs]

youngs

parents: 1318

diff changeset

1377 0320, 0321, 0322, 0323, 0324, 0325, 0326, 0327,

969b7290edca [xemacs-hg @ 2003-04-24 05:33:43 by youngs]

youngs

parents: 1318

diff changeset

1378 0330, 0331, 0332, 0333, 0334, 0335, 0336, 0337,

969b7290edca [xemacs-hg @ 2003-04-24 05:33:43 by youngs]

youngs

parents: 1318

diff changeset

1379 0340, 0341, 0342, 0343, 0344, 0345, 0346, 0347,

969b7290edca [xemacs-hg @ 2003-04-24 05:33:43 by youngs]

youngs

parents: 1318

diff changeset

1380 0350, 0351, 0352, 0353, 0354, 0355, 0356, 0357,

969b7290edca [xemacs-hg @ 2003-04-24 05:33:43 by youngs]

youngs

parents: 1318

diff changeset

1381 0360, 0361, 0362, 0363, 0364, 0365, 0366, 0367,

969b7290edca [xemacs-hg @ 2003-04-24 05:33:43 by youngs]

youngs

parents: 1318

diff changeset

1382 0370, 0371, 0372, 0373, 0374, 0375, 0376, 0377

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1383 };

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1384

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1385 /* A version that works like generic strcasecmp() -- only collapsing

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1386 case in ASCII A-Z/a-z. This is safe on Mule strings due to the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1387 current representation.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1388

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1389 This version was written by some Berkeley coder, favoring

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1390 nanosecond improvements over clarity. In all other versions below,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1391 we use symmetrical algorithms that may sacrifice a few machine

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1392 cycles but are MUCH MUCH clearer, which counts a lot more.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1393 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1394

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1395 int

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1396 qxestrcasecmp (const Ibyte *s1, const Ibyte *s2)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1397 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1398 Ibyte *cm = strcasecmp_charmap;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1399

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1400 while (cm[*s1] == cm[*s2++])

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1401 if (*s1++ == '\0')

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1402 return (0);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1403

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1404 return (cm[*s1] - cm[*--s2]);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1405 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1406

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1407 int

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1408 ascii_strcasecmp (const Ascbyte *s1, const Ascbyte *s2)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1409 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1410 return qxestrcasecmp ((const Ibyte *) s1, (const Ibyte *) s2);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1411 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1412

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1413 int

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1414 qxestrcasecmp_ascii (const Ibyte *s1, const Ascbyte *s2)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1415 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1416 return qxestrcasecmp (s1, (const Ibyte *) s2);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1417 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1418

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1419 /* An internationalized version that collapses case in a general fashion.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1420 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1421

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1422 int

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1423 qxestrcasecmp_i18n (const Ibyte *s1, const Ibyte *s2)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1424 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1425 while (*s1 && *s2)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1426 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1427 if (DOWNCASE (0, itext_ichar (s1)) !=

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1428 DOWNCASE (0, itext_ichar (s2)))

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1429 break;

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1430 INC_IBYTEPTR (s1);

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1431 INC_IBYTEPTR (s2);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1432 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1433

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1434 return (DOWNCASE (0, itext_ichar (s1)) -

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1435 DOWNCASE (0, itext_ichar (s2)));

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1436 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1437

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1438 /* The only difference between these next two and

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1439 qxememcasecmp()/qxememcasecmp_i18n() is that these two will stop if

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1440 both strings are equal and less than LEN in length, while

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1441 the mem...() versions would would run off the end. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1442

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1443 int

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1444 qxestrncasecmp (const Ibyte *s1, const Ibyte *s2, Bytecount len)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1445 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1446 Ibyte *cm = strcasecmp_charmap;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1447

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1448 while (len--)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1449 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1450 int diff = cm[*s1] - cm[*s2];

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1451 if (diff != 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1452 return diff;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1453 if (!*s1)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1454 return 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1455 s1++, s2++;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1456 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1457

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1458 return 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1459 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1460

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1461 int

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1462 ascii_strncasecmp (const Ascbyte *s1, const Ascbyte *s2, Bytecount len)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1463 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1464 return qxestrncasecmp ((const Ibyte *) s1, (const Ibyte *) s2, len);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1465 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1466

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1467 int

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1468 qxestrncasecmp_ascii (const Ibyte *s1, const Ascbyte *s2, Bytecount len)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1469 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1470 return qxestrncasecmp (s1, (const Ibyte *) s2, len);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1471 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1472

801

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1473 /* Compare LEN_FROM_S1 worth of characters from S1 with the same number of

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1474 characters from S2, case insensitive. NOTE: Downcasing can convert

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1475 characters from one length in bytes to another, so reversing S1 and S2

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1476 is *NOT* a symmetric operations! You must choose a length that agrees

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1477 with S1. */

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1478

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1479 int

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1480 qxestrncasecmp_i18n (const Ibyte *s1, const Ibyte *s2,

801

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1481 Bytecount len_from_s1)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1482 {

801

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1483 while (len_from_s1 > 0)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1484 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1485 const Ibyte *old_s1 = s1;

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1486 int diff = (DOWNCASE (0, itext_ichar (s1)) -

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1487 DOWNCASE (0, itext_ichar (s2)));

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1488 if (diff != 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1489 return diff;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1490 if (!*s1)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1491 return 0;

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1492 INC_IBYTEPTR (s1);

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1493 INC_IBYTEPTR (s2);

801

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1494 len_from_s1 -= s1 - old_s1;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1495 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1496

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1497 return 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1498 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1499

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1500 int

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1501 qxememcmp (const Ibyte *s1, const Ibyte *s2, Bytecount len)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1502 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1503 return memcmp (s1, s2, len);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1504 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1505

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1506 int

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1507 qxememcmp4 (const Ibyte *s1, Bytecount len1,

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1508 const Ibyte *s2, Bytecount len2)

801

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1509 {

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1510 int retval = qxememcmp (s1, s2, min (len1, len2));

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1511 if (retval)

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1512 return retval;

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1513 return len1 - len2;

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1514 }

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1515

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1516 int

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1517 qxememcasecmp (const Ibyte *s1, const Ibyte *s2, Bytecount len)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1518 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1519 Ibyte *cm = strcasecmp_charmap;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1520

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1521 while (len--)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1522 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1523 int diff = cm[*s1] - cm[*s2];

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1524 if (diff != 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1525 return diff;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1526 s1++, s2++;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1527 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1528

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1529 return 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1530 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1531

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1532 int

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1533 qxememcasecmp4 (const Ibyte *s1, Bytecount len1,

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1534 const Ibyte *s2, Bytecount len2)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1535 {

801

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1536 int retval = qxememcasecmp (s1, s2, min (len1, len2));

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1537 if (retval)

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1538 return retval;

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1539 return len1 - len2;

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1540 }

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1541

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1542 /* Do a character-by-character comparison, returning "which is greater" by

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1543 comparing the Ichar values. (#### Should have option to compare Unicode

801

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1544 points) */

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1545

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1546 int

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1547 qxetextcmp (const Ibyte *s1, Bytecount len1,

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1548 const Ibyte *s2, Bytecount len2)

801

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1549 {

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1550 while (len1 > 0 && len2 > 0)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1551 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1552 const Ibyte *old_s1 = s1;

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1553 const Ibyte *old_s2 = s2;

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1554 int diff = itext_ichar (s1) - itext_ichar (s2);

801

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1555 if (diff != 0)

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1556 return diff;

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1557 INC_IBYTEPTR (s1);

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1558 INC_IBYTEPTR (s2);

801

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1559 len1 -= s1 - old_s1;

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1560 len2 -= s2 - old_s2;

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1561 }

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1562

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1563 assert (len1 >= 0 && len2 >= 0);

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1564 return len1 - len2;

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1565 }

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1566

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1567 int

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1568 qxetextcmp_matching (const Ibyte *s1, Bytecount len1,

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1569 const Ibyte *s2, Bytecount len2,

801

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1570 Charcount *matching)

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1571 {

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1572 *matching = 0;

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1573 while (len1 > 0 && len2 > 0)

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1574 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1575 const Ibyte *old_s1 = s1;

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1576 const Ibyte *old_s2 = s2;

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1577 int diff = itext_ichar (s1) - itext_ichar (s2);

801

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1578 if (diff != 0)

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1579 return diff;

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1580 INC_IBYTEPTR (s1);

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1581 INC_IBYTEPTR (s2);

801

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1582 len1 -= s1 - old_s1;

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1583 len2 -= s2 - old_s2;

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1584 (*matching)++;

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1585 }

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1586

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1587 assert (len1 >= 0 && len2 >= 0);

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1588 return len1 - len2;

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1589 }

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1590

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1591 /* Do a character-by-character comparison, returning "which is greater" by

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1592 comparing the Ichar values, case insensitively (by downcasing both

801

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1593 first). (#### Should have option to compare Unicode points)

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1594

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1595 In this case, both lengths must be specified becaused downcasing can

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1596 convert characters from one length in bytes to another; therefore, two

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1597 blocks of text of different length might be equal. If both compare

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1598 equal up to the limit in length of one but not the other, the longer one

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1599 is "greater". */

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1600

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1601 int

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1602 qxetextcasecmp (const Ibyte *s1, Bytecount len1,

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1603 const Ibyte *s2, Bytecount len2)

801

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1604 {

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1605 while (len1 > 0 && len2 > 0)

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1606 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1607 const Ibyte *old_s1 = s1;

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1608 const Ibyte *old_s2 = s2;

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1609 int diff = (DOWNCASE (0, itext_ichar (s1)) -

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1610 DOWNCASE (0, itext_ichar (s2)));

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1611 if (diff != 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1612 return diff;

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1613 INC_IBYTEPTR (s1);

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1614 INC_IBYTEPTR (s2);

801

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1615 len1 -= s1 - old_s1;

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1616 len2 -= s2 - old_s2;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1617 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1618

801

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1619 assert (len1 >= 0 && len2 >= 0);

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1620 return len1 - len2;

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1621 }

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1622

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1623 /* Like qxetextcasecmp() but also return number of characters at

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1624 beginning that match. */

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1625

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1626 int

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1627 qxetextcasecmp_matching (const Ibyte *s1, Bytecount len1,

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1628 const Ibyte *s2, Bytecount len2,

801

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1629 Charcount *matching)

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1630 {

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1631 *matching = 0;

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1632 while (len1 > 0 && len2 > 0)

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1633 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1634 const Ibyte *old_s1 = s1;

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1635 const Ibyte *old_s2 = s2;

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1636 int diff = (DOWNCASE (0, itext_ichar (s1)) -

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1637 DOWNCASE (0, itext_ichar (s2)));

801

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1638 if (diff != 0)

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1639 return diff;

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1640 INC_IBYTEPTR (s1);

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1641 INC_IBYTEPTR (s2);

801

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1642 len1 -= s1 - old_s1;

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1643 len2 -= s2 - old_s2;

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1644 (*matching)++;

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1645 }

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1646

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1647 assert (len1 >= 0 && len2 >= 0);

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1648 return len1 - len2;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1649 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1650

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1651 int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1652 lisp_strcasecmp (Lisp_Object s1, Lisp_Object s2)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1653 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1654 Ibyte *cm = strcasecmp_charmap;

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1655 Ibyte *p1 = XSTRING_DATA (s1);

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1656 Ibyte *p2 = XSTRING_DATA (s2);

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1657 Ibyte *e1 = p1 + XSTRING_LENGTH (s1);

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1658 Ibyte *e2 = p2 + XSTRING_LENGTH (s2);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1659

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1660 /* again, we use a symmetric algorithm and favor clarity over

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1661 nanosecond improvements. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1662 while (1)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1663 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1664 /* if we reached the end of either string, compare lengths.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1665 do NOT compare the final null byte against anything, in case

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1666 the other string also has a null byte at that position. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1667 if (p1 == e1 || p2 == e2)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1668 return e1 - e2;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1669 if (cm[*p1] != cm[*p2])

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1670 return cm[*p1] - cm[*p2];

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1671 p1++, p2++;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1672 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1673 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1674

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1675 int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1676 lisp_strcasecmp_i18n (Lisp_Object s1, Lisp_Object s2)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1677 {

801

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1678 return qxetextcasecmp (XSTRING_DATA (s1), XSTRING_LENGTH (s1),

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1679 XSTRING_DATA (s2), XSTRING_LENGTH (s2));

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1680 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1681

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1682 /* Compare a wide string with an ASCII string */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1683

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1684 int

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1685 wcscmp_ascii (const wchar_t *s1, const Ascbyte *s2)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1686 {

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1687 while (*s1 && *s2)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1688 {

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1689 if (*s1 != *s2)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1690 break;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1691 s1++, s2++;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1692 }

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1693

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1694 return *s1 - *s2;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1695 }

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1696

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1697 int

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1698 wcsncmp_ascii (const wchar_t *s1, const Ascbyte *s2, Charcount len)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1699 {

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1700 while (len--)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1701 {

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1702 int diff = *s1 - *s2;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1703 if (diff != 0)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1704 return diff;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1705 if (!*s1)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1706 return 0;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1707 s1++, s2++;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1708 }

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1709

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1710 return 0;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1711 }

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1712

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1713

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1714 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1715 /* conversion between textual representations */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1716 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1717

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1718 /* NOTE: Does not reset the Dynarr. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1719

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1720 void

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1721 convert_ibyte_string_into_ichar_dynarr (const Ibyte *str, Bytecount len,

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1722 Ichar_dynarr *dyn)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1723 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1724 const Ibyte *strend = str + len;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1725

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1726 while (str < strend)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1727 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1728 Ichar ch = itext_ichar (str);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1729 Dynarr_add (dyn, ch);

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1730 INC_IBYTEPTR (str);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1731 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1732 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1733

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1734 Charcount

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1735 convert_ibyte_string_into_ichar_string (const Ibyte *str, Bytecount len,

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1736 Ichar *arr)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1737 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1738 const Ibyte *strend = str + len;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1739 Charcount newlen = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1740 while (str < strend)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1741 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1742 Ichar ch = itext_ichar (str);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1743 arr[newlen++] = ch;

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1744 INC_IBYTEPTR (str);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1745 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1746 return newlen;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1747 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1748

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1749 /* Convert an array of Ichars into the equivalent string representation.

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1750 Store into the given Ibyte dynarr. Does not reset the dynarr.

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1751 Does not add a terminating zero. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1752

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1753 void

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1754 convert_ichar_string_into_ibyte_dynarr (Ichar *arr, int nels,

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1755 Ibyte_dynarr *dyn)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1756 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1757 Ibyte str[MAX_ICHAR_LEN];

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1758 int i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1759

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1760 for (i = 0; i < nels; i++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1761 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1762 Bytecount len = set_itext_ichar (str, arr[i]);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1763 Dynarr_add_many (dyn, str, len);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1764 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1765 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1766

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1767 /* Convert an array of Ichars into the equivalent string representation.

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1768 Malloc the space needed for this and return it. If LEN_OUT is not a

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1769 NULL pointer, store into LEN_OUT the number of Ibytes in the

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1770 malloc()ed string. Note that the actual number of Ibytes allocated

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1771 is one more than this: the returned string is zero-terminated. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1772

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1773 Ibyte *

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1774 convert_ichar_string_into_malloced_string (Ichar *arr, int nels,

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1775 Bytecount *len_out)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1776 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1777 /* Damn zero-termination. */

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1778 Ibyte *str = alloca_ibytes (nels * MAX_ICHAR_LEN + 1);

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1779 Ibyte *strorig = str;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1780 Bytecount len;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1781

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1782 int i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1783

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1784 for (i = 0; i < nels; i++)

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1785 str += set_itext_ichar (str, arr[i]);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1786 *str = '\0';

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1787 len = str - strorig;

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

1788 str = xnew_ibytes (1 + len);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1789 memcpy (str, strorig, 1 + len);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1790 if (len_out)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1791 *len_out = len;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1792 return str;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1793 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1794

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1795 #define COPY_TEXT_BETWEEN_FORMATS(srcfmt, dstfmt) \

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1796 do \

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1797 { \

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1798 if (dst) \

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1799 { \

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1800 Ibyte *dstend = dst + dstlen; \

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1801 Ibyte *dstp = dst; \

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1802 const Ibyte *srcend = src + srclen; \

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1803 const Ibyte *srcp = src; \

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1804 \

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1805 while (srcp < srcend) \

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1806 { \

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1807 Ichar ch = itext_ichar_fmt (srcp, srcfmt, srcobj); \

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1808 Bytecount len = ichar_len_fmt (ch, dstfmt); \

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1809 \

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1810 if (dstp + len <= dstend) \

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1811 { \

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1812 set_itext_ichar_fmt (dstp, ch, dstfmt, dstobj); \

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1813 dstp += len; \

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1814 } \

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1815 else \

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1816 break; \

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1817 INC_IBYTEPTR_FMT (srcp, srcfmt); \

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1818 } \

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1819 text_checking_assert (srcp <= srcend); \

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1820 if (src_used) \

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1821 *src_used = srcp - src; \

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1822 return dstp - dst; \

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1823 } \

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1824 else \

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1825 { \

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1826 const Ibyte *srcend = src + srclen; \

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1827 const Ibyte *srcp = src; \

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1828 Bytecount total = 0; \

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1829 \

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1830 while (srcp < srcend) \

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1831 { \

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1832 total += ichar_len_fmt (itext_ichar_fmt (srcp, srcfmt, \

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1833 srcobj), dstfmt); \

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1834 INC_IBYTEPTR_FMT (srcp, srcfmt); \

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1835 } \

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1836 text_checking_assert (srcp == srcend); \

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1837 if (src_used) \

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1838 *src_used = srcp - src; \

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1839 return total; \

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1840 } \

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1841 } \

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1842 while (0)

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1843

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1844 /* Copy as much text from SRC/SRCLEN to DST/DSTLEN as will fit, converting

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1845 from SRCFMT/SRCOBJ to DSTFMT/DSTOBJ. Return number of bytes stored into

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1846 DST as return value, and number of bytes copied from SRC through

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1847 SRC_USED (if not NULL). If DST is NULL, don't actually store anything

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1848 and just return the size needed to store all the text. Will not copy

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1849 partial characters into DST. */

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1850

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1851 Bytecount

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1852 copy_text_between_formats (const Ibyte *src, Bytecount srclen,

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1853 Internal_Format srcfmt,

2333

ba4677f54a05 [xemacs-hg @ 2004-10-14 17:26:18 by james]

james

parents: 2286

diff changeset

1854 Lisp_Object USED_IF_MULE (srcobj),

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1855 Ibyte *dst, Bytecount dstlen,

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1856 Internal_Format dstfmt,

2333

ba4677f54a05 [xemacs-hg @ 2004-10-14 17:26:18 by james]

james

parents: 2286

diff changeset

1857 Lisp_Object USED_IF_MULE (dstobj),

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1858 Bytecount *src_used)

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1859 {

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1860 if (srcfmt == dstfmt &&

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1861 objects_have_same_internal_representation (srcobj, dstobj))

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1862 {

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1863 if (dst)

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1864 {

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1865 srclen = min (srclen, dstlen);

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1866 srclen = validate_ibyte_string_backward (src, srclen);

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1867 memcpy (dst, src, srclen);

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1868 if (src_used)

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1869 *src_used = srclen;

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1870 return srclen;

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1871 }

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1872 else

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1873 return srclen;

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1874 }

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1875 /* Everything before the final else statement is an optimization.

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1876 The inner loops inside COPY_TEXT_BETWEEN_FORMATS() have a number

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1877 of calls to *_fmt(), each of which has a switch statement in it.

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1878 By using constants as the FMT argument, these switch statements

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1879 will be optimized out of existence. */

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1880 #define ELSE_FORMATS(fmt1, fmt2) \

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1881 else if (srcfmt == fmt1 && dstfmt == fmt2) \

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1882 COPY_TEXT_BETWEEN_FORMATS (fmt1, fmt2)

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1883 ELSE_FORMATS (FORMAT_DEFAULT, FORMAT_8_BIT_FIXED);

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1884 ELSE_FORMATS (FORMAT_8_BIT_FIXED, FORMAT_DEFAULT);

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1885 ELSE_FORMATS (FORMAT_DEFAULT, FORMAT_32_BIT_FIXED);

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1886 ELSE_FORMATS (FORMAT_32_BIT_FIXED, FORMAT_DEFAULT);

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1887 else

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1888 COPY_TEXT_BETWEEN_FORMATS (srcfmt, dstfmt);

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1889 #undef ELSE_FORMATS

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1890 }

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1891

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1892 /* Copy as much buffer text in BUF, starting at POS, of length LEN, as will

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1893 fit into DST/DSTLEN, converting to DSTFMT. Return number of bytes

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1894 stored into DST as return value, and number of bytes copied from BUF

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1895 through SRC_USED (if not NULL). If DST is NULL, don't actually store

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1896 anything and just return the size needed to store all the text. */

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1897

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1898 Bytecount

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1899 copy_buffer_text_out (struct buffer *buf, Bytebpos pos,

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1900 Bytecount len, Ibyte *dst, Bytecount dstlen,

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1901 Internal_Format dstfmt, Lisp_Object dstobj,

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1902 Bytecount *src_used)

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1903 {

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1904 Bytecount dst_used = 0;

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1905 if (src_used)

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1906 *src_used = 0;

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1907

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1908 {

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1909 BUFFER_TEXT_LOOP (buf, pos, len, runptr, runlen)

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1910 {

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1911 Bytecount the_src_used, the_dst_used;

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1912

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1913 the_dst_used = copy_text_between_formats (runptr, runlen,

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1914 BUF_FORMAT (buf),

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1915 wrap_buffer (buf),

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1916 dst, dstlen, dstfmt,

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1917 dstobj, &the_src_used);

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1918 dst_used += the_dst_used;

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1919 if (src_used)

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1920 *src_used += the_src_used;

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1921 if (dst)

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1922 {

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1923 dst += the_dst_used;

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1924 dstlen -= the_dst_used;

841

44478bd99873 [xemacs-hg @ 2002-05-14 15:15:58 by ben]

ben

parents: 826

diff changeset

1925 /* Stop if we didn't use all of the source text. Also stop

44478bd99873 [xemacs-hg @ 2002-05-14 15:15:58 by ben]

ben

parents: 826

diff changeset

1926 if the destination is full. We need the first test because

44478bd99873 [xemacs-hg @ 2002-05-14 15:15:58 by ben]

ben

parents: 826

diff changeset

1927 there might be a couple bytes left in the destination, but

44478bd99873 [xemacs-hg @ 2002-05-14 15:15:58 by ben]

ben

parents: 826

diff changeset

1928 not enough to fit a full character. The first test will in

44478bd99873 [xemacs-hg @ 2002-05-14 15:15:58 by ben]

ben

parents: 826

diff changeset

1929 fact catch the vast majority of cases where the destination

44478bd99873 [xemacs-hg @ 2002-05-14 15:15:58 by ben]

ben

parents: 826

diff changeset

1930 is empty, too -- but in case the destination holds *exactly*

44478bd99873 [xemacs-hg @ 2002-05-14 15:15:58 by ben]

ben

parents: 826

diff changeset

1931 the run length, we put in the second check. (It shouldn't

44478bd99873 [xemacs-hg @ 2002-05-14 15:15:58 by ben]

ben

parents: 826

diff changeset

1932 really matter though -- next time through we'll just get a

44478bd99873 [xemacs-hg @ 2002-05-14 15:15:58 by ben]

ben

parents: 826

diff changeset

1933 0.) */

44478bd99873 [xemacs-hg @ 2002-05-14 15:15:58 by ben]

ben

parents: 826

diff changeset

1934 if (the_src_used < runlen || !dstlen)

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1935 break;

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1936 }

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1937 }

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1938 }

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1939

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1940 return dst_used;

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1941 }

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

1942

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1943

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1944 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1945 /* charset properties of strings */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1946 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1947

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1948 void

2333

ba4677f54a05 [xemacs-hg @ 2004-10-14 17:26:18 by james]

james

parents: 2286

diff changeset

1949 find_charsets_in_ibyte_string (unsigned char *charsets,

ba4677f54a05 [xemacs-hg @ 2004-10-14 17:26:18 by james]

james

parents: 2286

diff changeset

1950 const Ibyte *USED_IF_MULE (str),

ba4677f54a05 [xemacs-hg @ 2004-10-14 17:26:18 by james]

james

parents: 2286

diff changeset

1951 Bytecount USED_IF_MULE (len))

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1952 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1953 #ifndef MULE

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1954 /* Telescope this. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1955 charsets[0] = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1956 #else

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1957 const Ibyte *strend = str + len;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1958 memset (charsets, 0, NUM_LEADING_BYTES);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1959

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1960 /* #### SJT doesn't like this. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1961 if (len == 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1962 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1963 charsets[XCHARSET_LEADING_BYTE (Vcharset_ascii) - MIN_LEADING_BYTE] = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1964 return;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1965 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1966

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1967 while (str < strend)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1968 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1969 charsets[ichar_leading_byte (itext_ichar (str)) - MIN_LEADING_BYTE] =

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1970 1;

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1971 INC_IBYTEPTR (str);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1972 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1973 #endif

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1974 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1975

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1976 void

2333

ba4677f54a05 [xemacs-hg @ 2004-10-14 17:26:18 by james]

james

parents: 2286

diff changeset

1977 find_charsets_in_ichar_string (unsigned char *charsets,

ba4677f54a05 [xemacs-hg @ 2004-10-14 17:26:18 by james]

james

parents: 2286

diff changeset

1978 const Ichar *USED_IF_MULE (str),

ba4677f54a05 [xemacs-hg @ 2004-10-14 17:26:18 by james]

james

parents: 2286

diff changeset

1979 Charcount USED_IF_MULE (len))

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1980 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1981 #ifndef MULE

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1982 /* Telescope this. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1983 charsets[0] = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1984 #else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1985 int i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1986

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1987 memset (charsets, 0, NUM_LEADING_BYTES);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1988

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1989 /* #### SJT doesn't like this. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1990 if (len == 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1991 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1992 charsets[XCHARSET_LEADING_BYTE (Vcharset_ascii) - MIN_LEADING_BYTE] = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1993 return;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1994 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1995

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1996 for (i = 0; i < len; i++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1997 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

1998 charsets[ichar_leading_byte (str[i]) - MIN_LEADING_BYTE] = 1;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

1999 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2000 #endif

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2001 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2002

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2003 int

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

2004 ibyte_string_displayed_columns (const Ibyte *str, Bytecount len)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2005 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2006 int cols = 0;

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

2007 const Ibyte *end = str + len;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2008

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2009 while (str < end)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2010 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2011 #ifdef MULE

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

2012 Ichar ch = itext_ichar (str);

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

2013 cols += XCHARSET_COLUMNS (ichar_charset (ch));

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2014 #else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2015 cols++;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2016 #endif

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

2017 INC_IBYTEPTR (str);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2018 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2019

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2020 return cols;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2021 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2022

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2023 int

2333

ba4677f54a05 [xemacs-hg @ 2004-10-14 17:26:18 by james]

james

parents: 2286

diff changeset

2024 ichar_string_displayed_columns (const Ichar *USED_IF_MULE (str), Charcount len)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2025 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2026 #ifdef MULE

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2027 int cols = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2028 int i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2029

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2030 for (i = 0; i < len; i++)

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

2031 cols += XCHARSET_COLUMNS (ichar_charset (str[i]));

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2032

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2033 return cols;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2034 #else /* not MULE */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2035 return len;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2036 #endif

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2037 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2038

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2039 Charcount

2333

ba4677f54a05 [xemacs-hg @ 2004-10-14 17:26:18 by james]

james

parents: 2286

diff changeset

2040 ibyte_string_nonascii_chars (const Ibyte *USED_IF_MULE (str),

ba4677f54a05 [xemacs-hg @ 2004-10-14 17:26:18 by james]

james

parents: 2286

diff changeset

2041 Bytecount USED_IF_MULE (len))

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2042 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2043 #ifdef MULE

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

2044 const Ibyte *end = str + len;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2045 Charcount retval = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2046

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2047 while (str < end)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2048 {

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2049 if (!byte_ascii_p (*str))

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2050 retval++;

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

2051 INC_IBYTEPTR (str);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2052 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2053

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2054 return retval;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2055 #else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2056 return 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2057 #endif

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2058 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2059

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2060

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2061 /***************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2062 /* Eistring helper functions */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2063 /***************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2064

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2065 int

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

2066 eistr_casefiddle_1 (Ibyte *olddata, Bytecount len, Ibyte *newdata,

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2067 int downp)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2068 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

2069 Ibyte *endp = olddata + len;

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

2070 Ibyte *newp = newdata;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2071 int changedp = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2072

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2073 while (olddata < endp)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2074 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

2075 Ichar c = itext_ichar (olddata);

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

2076 Ichar newc;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2077

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2078 if (downp)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2079 newc = DOWNCASE (0, c);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2080 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2081 newc = UPCASE (0, c);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2082

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2083 if (c != newc)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2084 changedp = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2085

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

2086 newp += set_itext_ichar (newp, newc);

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

2087 INC_IBYTEPTR (olddata);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2088 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2089

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2090 *newp = '\0';

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2091

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2092 return changedp ? newp - newdata : 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2093 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2094

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2095 int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2096 eifind_large_enough_buffer (int oldbufsize, int needed_size)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2097 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2098 while (oldbufsize < needed_size)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2099 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2100 oldbufsize = oldbufsize * 3 / 2;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2101 oldbufsize = max (oldbufsize, 32);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2102 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2103

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2104 return oldbufsize;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2105 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2106

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2107 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2108 eito_malloc_1 (Eistring *ei)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2109 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2110 if (ei->mallocp_)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2111 return;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2112 ei->mallocp_ = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2113 if (ei->data_)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2114 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

2115 Ibyte *newdata;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2116

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2117 ei->max_size_allocated_ =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2118 eifind_large_enough_buffer (0, ei->bytelen_ + 1);

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2119 newdata = xnew_ibytes (ei->max_size_allocated_);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2120 memcpy (newdata, ei->data_, ei->bytelen_ + 1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2121 ei->data_ = newdata;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2122 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2123

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2124 if (ei->extdata_)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2125 {

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2126 Extbyte *newdata = xnew_extbytes (ei->extlen_ + 2);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2127

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2128 memcpy (newdata, ei->extdata_, ei->extlen_);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2129 /* Double null-terminate in case of Unicode data */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2130 newdata[ei->extlen_] = '\0';

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2131 newdata[ei->extlen_ + 1] = '\0';

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2132 ei->extdata_ = newdata;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2133 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2134 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2135

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2136 int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2137 eicmp_1 (Eistring *ei, Bytecount off, Charcount charoff,

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

2138 Bytecount len, Charcount charlen, const Ibyte *data,

2421

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

2139 const Eistring *ei2, int is_ascii, int fold_case)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2140 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2141 assert ((off < 0) != (charoff < 0));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2142 if (off < 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2143 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2144 off = charcount_to_bytecount (ei->data_, charoff);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2145 if (charlen < 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2146 len = -1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2147 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2148 len = charcount_to_bytecount (ei->data_ + off, charlen);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2149 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2150 if (len < 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2151 len = ei->bytelen_ - off;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2152

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2153 assert (off >= 0 && off <= ei->bytelen_);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2154 assert (len >= 0 && off + len <= ei->bytelen_);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2155 assert ((data == 0) != (ei == 0));

2421

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

2156 assert ((is_ascii != 0) == (data != 0));

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2157 assert (fold_case >= 0 && fold_case <= 2);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2158

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2159 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2160 Bytecount dstlen;

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

2161 const Ibyte *src = ei->data_, *dst;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2162

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2163 if (data)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2164 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2165 dst = data;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2166 dstlen = qxestrlen (data);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2167 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2168 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2169 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2170 dst = ei2->data_;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2171 dstlen = ei2->bytelen_;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2172 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2173

2421

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

2174 if (is_ascii)

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2175 ASSERT_ASCTEXT_ASCII_LEN ((Ascbyte *) dst, dstlen);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2176

801

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

2177 return (fold_case == 0 ? qxememcmp4 (src, len, dst, dstlen) :

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

2178 fold_case == 1 ? qxememcasecmp4 (src, len, dst, dstlen) :

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

2179 qxetextcasecmp (src, len, dst, dstlen));

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2180 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2181 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2182

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

2183 Ibyte *

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2184 eicpyout_malloc_fmt (Eistring *eistr, Bytecount *len_out, Internal_Format fmt,

2286

04bc9d2f42c7 [xemacs-hg @ 2004-09-20 19:18:55 by james]

james

parents: 1726

diff changeset

2185 Lisp_Object UNUSED (object))

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2186 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

2187 Ibyte *ptr;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2188

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2189 assert (fmt == FORMAT_DEFAULT);

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

2190 ptr = xnew_array (Ibyte, eistr->bytelen_ + 1);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2191 if (len_out)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2192 *len_out = eistr->bytelen_;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2193 memcpy (ptr, eistr->data_, eistr->bytelen_ + 1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2194 return ptr;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2195 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2196

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2197

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2198 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2199 /* Charcount/Bytecount conversion */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2200 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2201

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2202 /* Optimization. Do it. Live it. Love it. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2203

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2204 #ifdef MULE

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2205

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2206 #ifdef EFFICIENT_INT_128_BIT

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2207 # define STRIDE_TYPE INT_128_BIT

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2208 # define HIGH_BIT_MASK \

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2209 MAKE_128_BIT_UNSIGNED_CONSTANT (0x80808080808080808080808080808080)

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2210 #elif defined (EFFICIENT_INT_64_BIT)

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2211 # define STRIDE_TYPE INT_64_BIT

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2212 # define HIGH_BIT_MASK MAKE_64_BIT_UNSIGNED_CONSTANT (0x8080808080808080)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2213 #else

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2214 # define STRIDE_TYPE INT_32_BIT

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2215 # define HIGH_BIT_MASK MAKE_32_BIT_UNSIGNED_CONSTANT (0x80808080)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2216 #endif

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2217

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2218 #define ALIGN_BITS ((EMACS_UINT) (ALIGNOF (STRIDE_TYPE) - 1))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2219 #define ALIGN_MASK (~ ALIGN_BITS)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2220 #define ALIGNED(ptr) ((((EMACS_UINT) ptr) & ALIGN_BITS) == 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2221 #define STRIDE sizeof (STRIDE_TYPE)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2222

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2223 /* Skip as many ASCII bytes as possible in the memory block [PTR, END).

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2224 Return pointer to the first non-ASCII byte. optimized for long

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2225 stretches of ASCII. */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2226 inline static const Ibyte *

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2227 skip_ascii (const Ibyte *ptr, const Ibyte *end)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2228 {

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2229 const unsigned STRIDE_TYPE *ascii_end;

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2230

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2231 /* Need to do in 3 sections -- before alignment start, aligned chunk,

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2232 after alignment end. */

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2233 while (!ALIGNED (ptr))

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2234 {

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2235 if (ptr == end || !byte_ascii_p (*ptr))

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2236 return ptr;

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2237 ptr++;

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2238 }

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2239 ascii_end = (const unsigned STRIDE_TYPE *) ptr;

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2240 /* This loop screams, because we can detect ASCII

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2241 characters 4 or 8 at a time. */

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

2242 while ((const Ibyte *) ascii_end + STRIDE <= end

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2243 && !(*ascii_end & HIGH_BIT_MASK))

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2244 ascii_end++;

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

2245 ptr = (Ibyte *) ascii_end;

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2246 while (ptr < end && byte_ascii_p (*ptr))

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2247 ptr++;

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2248 return ptr;

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2249 }

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2250

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2251 /* Skip as many ASCII bytes as possible in the memory block [END, PTR),

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2252 going downwards. Return pointer to the location above the first

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2253 non-ASCII byte. Optimized for long stretches of ASCII. */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2254 inline static const Ibyte *

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2255 skip_ascii_down (const Ibyte *ptr, const Ibyte *end)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2256 {

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2257 const unsigned STRIDE_TYPE *ascii_end;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2258

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2259 /* Need to do in 3 sections -- before alignment start, aligned chunk,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2260 after alignment end. */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2261 while (!ALIGNED (ptr))

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2262 {

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2263 if (ptr == end || !byte_ascii_p (*(ptr - 1)))

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2264 return ptr;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2265 ptr--;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2266 }

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2267 ascii_end = (const unsigned STRIDE_TYPE *) ptr - 1;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2268 /* This loop screams, because we can detect ASCII

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2269 characters 4 or 8 at a time. */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2270 while ((const Ibyte *) ascii_end >= end

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2271 && !(*ascii_end & HIGH_BIT_MASK))

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2272 ascii_end--;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2273 ptr = (Ibyte *) (ascii_end + 1);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2274 while (ptr > end && byte_ascii_p (*(ptr - 1)))

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2275 ptr--;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2276 return ptr;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2277 }

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2278

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2279 /* Function equivalents of bytecount_to_charcount/charcount_to_bytecount.

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2280 These work on strings of all sizes but are more efficient than a simple

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2281 loop on large strings and probably less efficient on sufficiently small

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2282 strings. */

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2283

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2284 Charcount

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

2285 bytecount_to_charcount_fun (const Ibyte *ptr, Bytecount len)

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2286 {

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2287 Charcount count = 0;

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

2288 const Ibyte *end = ptr + len;

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2289 while (1)

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2290 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

2291 const Ibyte *newptr = skip_ascii (ptr, end);

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2292 count += newptr - ptr;

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2293 ptr = newptr;

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2294 if (ptr == end)

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2295 break;

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2296 {

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2297 /* Optimize for successive characters from the same charset */

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

2298 Ibyte leading_byte = *ptr;

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2299 int bytes = rep_bytes_by_first_byte (leading_byte);

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2300 while (ptr < end && *ptr == leading_byte)

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2301 ptr += bytes, count++;

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2302 }

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2303 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2304

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2305 /* Bomb out if the specified substring ends in the middle

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2306 of a character. Note that we might have already gotten

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2307 a core dump above from an invalid reference, but at least

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2308 we will get no farther than here.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2309

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2310 This also catches len < 0. */

800

a5954632b187 [xemacs-hg @ 2002-03-31 08:27:14 by ben]

ben

parents: 793

diff changeset

2311 text_checking_assert (ptr == end);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2312

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2313 return count;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2314 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2315

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2316 Bytecount

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

2317 charcount_to_bytecount_fun (const Ibyte *ptr, Charcount len)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2318 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

2319 const Ibyte *newptr = ptr;

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2320 while (1)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2321 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

2322 const Ibyte *newnewptr = skip_ascii (newptr, newptr + len);

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2323 len -= newnewptr - newptr;

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2324 newptr = newnewptr;

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2325 if (!len)

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2326 break;

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2327 {

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2328 /* Optimize for successive characters from the same charset */

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

2329 Ibyte leading_byte = *newptr;

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2330 int bytes = rep_bytes_by_first_byte (leading_byte);

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2331 while (len > 0 && *newptr == leading_byte)

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2332 newptr += bytes, len--;

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2333 }

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2334 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2335 return newptr - ptr;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2336 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2337

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2338 /* Function equivalent of charcount_to_bytecount_down. This works on strings

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2339 of all sizes but is more efficient than a simple loop on large strings

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2340 and probably less efficient on sufficiently small strings. */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2341

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2342 Bytecount

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2343 charcount_to_bytecount_down_fun (const Ibyte *ptr, Charcount len)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2344 {

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2345 const Ibyte *newptr = ptr;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2346 while (1)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2347 {

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2348 const Ibyte *newnewptr = skip_ascii_down (newptr, newptr - len);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2349 len -= newptr - newnewptr;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2350 newptr = newnewptr;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2351 /* Skip over all non-ASCII chars, counting the length and

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2352 stopping if it's zero */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2353 while (len && !byte_ascii_p (*(newptr - 1)))

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2354 if (ibyte_first_byte_p (*--newptr))

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2355 len--;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2356 if (!len)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2357 break;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2358 }

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2359 text_checking_assert (ptr - newptr >= 0);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2360 return ptr - newptr;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2361 }

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2362

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2363 /* The next two functions are the actual meat behind the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2364 charbpos-to-bytebpos and bytebpos-to-charbpos conversions. Currently

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2365 the method they use is fairly unsophisticated; see buffer.h.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2366

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2367 Note that charbpos_to_bytebpos_func() is probably the most-called

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2368 function in all of XEmacs. Therefore, it must be FAST FAST FAST.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2369 This is the reason why so much of the code is duplicated.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2370

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2371 Similar considerations apply to bytebpos_to_charbpos_func(), although

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2372 less so because the function is not called so often.

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2373 */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2374

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2375 /*

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2376

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2377 Info on Byte-Char conversion:

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2378

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2379 (Info-goto-node "(internals)Byte-Char Position Conversion")

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2380 */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2381

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2382 #ifdef OLD_BYTE_CHAR

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2383 static int not_very_random_number;

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2384 #endif /* OLD_BYTE_CHAR */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2385

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2386 #define OLD_LOOP

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2387

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2388 /* If we are this many characters away from any known position, cache the

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2389 new position in the buffer's char-byte cache. */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2390 #define FAR_AWAY_DISTANCE 5000

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2391

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2392 /* Converting between character positions and byte positions. */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2393

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2394 /* There are several places in the buffer where we know

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2395 the correspondence: BEG, BEGV, PT, GPT, ZV and Z,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2396 and everywhere there is a marker. So we find the one of these places

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2397 that is closest to the specified position, and scan from there. */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2398

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2399 /* This macro is a subroutine of charbpos_to_bytebpos_func.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2400 Note that it is desirable that BYTEPOS is not evaluated

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2401 except when we really want its value. */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2402

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2403 #define CONSIDER(CHARPOS, BYTEPOS) \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2404 do \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2405 { \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2406 Charbpos this_charpos = (CHARPOS); \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2407 int changed = 0; \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2408 \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2409 if (this_charpos == x) \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2410 { \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2411 retval = (BYTEPOS); \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2412 goto done; \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2413 } \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2414 else if (this_charpos > x) \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2415 { \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2416 if (this_charpos < best_above) \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2417 { \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2418 best_above = this_charpos; \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2419 best_above_byte = (BYTEPOS); \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2420 changed = 1; \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2421 } \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2422 } \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2423 else if (this_charpos > best_below) \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2424 { \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2425 best_below = this_charpos; \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2426 best_below_byte = (BYTEPOS); \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2427 changed = 1; \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2428 } \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2429 \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2430 if (changed) \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2431 { \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2432 if (best_above - best_below == best_above_byte - best_below_byte) \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2433 { \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2434 retval = best_below_byte + (x - best_below); \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2435 goto done; \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2436 } \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2437 } \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2438 } \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2439 while (0)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2440

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2441

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2442 Bytebpos

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2443 charbpos_to_bytebpos_func (struct buffer *buf, Charbpos x)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2444 {

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2445 #ifdef OLD_BYTE_CHAR

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2446 Charbpos bufmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2447 Charbpos bufmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2448 Bytebpos bytmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2449 Bytebpos bytmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2450 int size;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2451 int forward_p;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2452 int diff_so_far;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2453 int add_to_cache = 0;

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2454 #endif /* OLD_BYTE_CHAR */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2455

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2456 Charbpos best_above, best_below;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2457 Bytebpos best_above_byte, best_below_byte;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2458 int i;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2459 struct buffer_text *t;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2460 Bytebpos retval;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2461

1292

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

2462 PROFILE_DECLARE ();

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2463

1292

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

2464 PROFILE_RECORD_ENTERING_SECTION (QSin_char_byte_conversion);

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

2465

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2466 best_above = BUF_Z (buf);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2467 best_above_byte = BYTE_BUF_Z (buf);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2468

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2469 /* In this case, we simply have all one-byte characters. But this should

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2470 have been intercepted before, in charbpos_to_bytebpos(). */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2471 text_checking_assert (best_above != best_above_byte);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2472

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2473 best_below = BUF_BEG (buf);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2474 best_below_byte = BYTE_BUF_BEG (buf);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2475

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2476 /* We find in best_above and best_above_byte

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2477 the closest known point above CHARPOS,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2478 and in best_below and best_below_byte

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2479 the closest known point below CHARPOS,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2480

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2481 If at any point we can tell that the space between those

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2482 two best approximations is all single-byte,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2483 we interpolate the result immediately. */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2484

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2485 CONSIDER (BUF_PT (buf), BYTE_BUF_PT (buf));

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2486 CONSIDER (BUF_GPT (buf), BYTE_BUF_GPT (buf));

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2487 CONSIDER (BUF_BEGV (buf), BYTE_BUF_BEGV (buf));

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2488 CONSIDER (BUF_ZV (buf), BYTE_BUF_ZV (buf));

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2489

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2490 t = buf->text;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2491 CONSIDER (t->cached_charpos, t->cached_bytepos);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2492

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2493 /* Check the most recently entered positions first */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2494

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2495 for (i = t->next_cache_pos - 1; i >= 0; i--)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2496 {

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2497 CONSIDER (t->mule_charbpos_cache[i], t->mule_bytebpos_cache[i]);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2498

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2499 /* If we are down to a range of 50 chars,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2500 don't bother checking any other markers;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2501 scan the intervening chars directly now. */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2502 if (best_above - best_below < 50)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2503 break;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2504 }

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2505

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2506 /* We get here if we did not exactly hit one of the known places.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2507 We have one known above and one known below.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2508 Scan, counting characters, from whichever one is closer. */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2509

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2510 if (x - best_below < best_above - x)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2511 {

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2512 int record = x - best_below > FAR_AWAY_DISTANCE;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2513

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2514 #ifdef OLD_LOOP /* old code */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2515 while (best_below != x)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2516 {

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2517 best_below++;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2518 INC_BYTEBPOS (buf, best_below_byte);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2519 }

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2520 #else

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2521 text_checking_assert (BUF_FORMAT (buf) == FORMAT_DEFAULT);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2522 /* The gap should not occur between best_below and x, or we will be

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2523 screwed in using charcount_to_bytecount(). It should not be exactly

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2524 at x either, because we already should have caught that. */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2525 text_checking_assert

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2526 (BUF_CEILING_OF_IGNORE_ACCESSIBLE (buf, best_below) > x);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2527

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2528 /* Using charcount_to_bytecount() is potentially a lot faster than a

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2529 simple loop using INC_BYTEBPOS() because (a) the checks for gap

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2530 and buffer format are factored out instead of getting checked

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2531 every time; (b) the checking goes 4 or 8 bytes at a time in ASCII

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2532 text.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2533 */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2534 best_below_byte +=

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2535 charcount_to_bytecount

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2536 (BYTE_BUF_BYTE_ADDRESS (buf, best_below_byte), x - best_below);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2537 best_below = x;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2538 #endif /* 0 */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2539

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2540 /* If this position is quite far from the nearest known position,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2541 cache the correspondence.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2542

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2543 NB FSF does this: "... by creating a marker here.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2544 It will last until the next GC."

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2545 */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2546

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2547 if (record)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2548 {

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2549 /* If we have run out of positions to record, discard some of the

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2550 old ones. I used to use a circular buffer, which avoids the

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2551 need to block-move any memory. But it makes it more difficult

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2552 to keep track of which positions haven't been used -- commonly

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2553 we haven't yet filled out anywhere near the whole set of

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2554 positions and don't want to check them all. We should not be

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2555 recording that often, and block-moving is extremely fast in

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2556 any case. --ben */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2557 if (t->next_cache_pos == NUM_CACHED_POSITIONS)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2558 {

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2559 memmove (t->mule_charbpos_cache,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2560 t->mule_charbpos_cache + NUM_MOVED_POSITIONS,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2561 sizeof (Charbpos) *

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2562 (NUM_CACHED_POSITIONS - NUM_MOVED_POSITIONS));

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2563 memmove (t->mule_bytebpos_cache,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2564 t->mule_bytebpos_cache + NUM_MOVED_POSITIONS,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2565 sizeof (Bytebpos) *

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2566 (NUM_CACHED_POSITIONS - NUM_MOVED_POSITIONS));

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2567 t->next_cache_pos -= NUM_MOVED_POSITIONS;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2568 }

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2569 t->mule_charbpos_cache[t->next_cache_pos] = best_below;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2570 t->mule_bytebpos_cache[t->next_cache_pos] = best_below_byte;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2571 t->next_cache_pos++;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2572 }

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2573

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2574 t->cached_charpos = best_below;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2575 t->cached_bytepos = best_below_byte;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2576

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2577 retval = best_below_byte;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2578 text_checking_assert (best_below_byte >= best_below);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2579 goto done;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2580 }

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2581 else

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2582 {

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2583 int record = best_above - x > FAR_AWAY_DISTANCE;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2584

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2585 #ifdef OLD_LOOP

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2586 while (best_above != x)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2587 {

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2588 best_above--;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2589 DEC_BYTEBPOS (buf, best_above_byte);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2590 }

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2591 #else

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2592 text_checking_assert (BUF_FORMAT (buf) == FORMAT_DEFAULT);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2593 /* The gap should not occur between best_above and x, or we will be

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2594 screwed in using charcount_to_bytecount_down(). It should not be

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2595 exactly at x either, because we already should have caught

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2596 that. */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2597 text_checking_assert

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2598 (BUF_FLOOR_OF_IGNORE_ACCESSIBLE (buf, best_above) < x);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2599

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2600 /* Using charcount_to_bytecount_down() is potentially a lot faster

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2601 than a simple loop using DEC_BYTEBPOS(); see above. */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2602 best_above_byte -=

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2603 charcount_to_bytecount_down

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2604 /* BYTE_BUF_BYTE_ADDRESS will return a value on the high side of the

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2605 gap if we are at the gap, which is the wrong side. So do the

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2606 following trick instead. */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2607 (BYTE_BUF_BYTE_ADDRESS_BEFORE (buf, best_above_byte) + 1,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2608 best_above - x);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2609 best_above = x;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2610 #endif /* SLEDGEHAMMER_CHECK_TEXT */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2611

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2612

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2613 /* If this position is quite far from the nearest known position,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2614 cache the correspondence.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2615

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2616 NB FSF does this: "... by creating a marker here.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2617 It will last until the next GC."

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2618 */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2619 if (record)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2620 {

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2621 if (t->next_cache_pos == NUM_CACHED_POSITIONS)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2622 {

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2623 memmove (t->mule_charbpos_cache,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2624 t->mule_charbpos_cache + NUM_MOVED_POSITIONS,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2625 sizeof (Charbpos) *

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2626 (NUM_CACHED_POSITIONS - NUM_MOVED_POSITIONS));

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2627 memmove (t->mule_bytebpos_cache,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2628 t->mule_bytebpos_cache + NUM_MOVED_POSITIONS,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2629 sizeof (Bytebpos) *

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2630 (NUM_CACHED_POSITIONS - NUM_MOVED_POSITIONS));

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2631 t->next_cache_pos -= NUM_MOVED_POSITIONS;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2632 }

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2633 t->mule_charbpos_cache[t->next_cache_pos] = best_above;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2634 t->mule_bytebpos_cache[t->next_cache_pos] = best_above_byte;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2635 t->next_cache_pos++;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2636 }

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2637

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2638 t->cached_charpos = best_above;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2639 t->cached_bytepos = best_above_byte;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2640

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2641 retval = best_above_byte;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2642 text_checking_assert (best_above_byte >= best_above);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2643 goto done;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2644 }

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2645

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2646 #ifdef OLD_BYTE_CHAR

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2647

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2648 bufmin = buf->text->mule_bufmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2649 bufmax = buf->text->mule_bufmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2650 bytmin = buf->text->mule_bytmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2651 bytmax = buf->text->mule_bytmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2652 size = (1 << buf->text->mule_shifter) + !!buf->text->mule_three_p;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2653

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2654 /* The basic idea here is that we shift the "known region" up or down

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2655 until it overlaps the specified position. We do this by moving

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2656 the upper bound of the known region up one character at a time,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2657 and moving the lower bound of the known region up as necessary

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2658 when the size of the character just seen changes.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2659

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2660 We optimize this, however, by first shifting the known region to

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2661 one of the cached points if it's close by. (We don't check BEG or

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2662 Z, even though they're cached; most of the time these will be the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2663 same as BEGV and ZV, and when they're not, they're not likely

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2664 to be used.) */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2665

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2666 if (x > bufmax)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2667 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2668 Charbpos diffmax = x - bufmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2669 Charbpos diffpt = x - BUF_PT (buf);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2670 Charbpos diffzv = BUF_ZV (buf) - x;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2671 /* #### This value could stand some more exploration. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2672 Charcount heuristic_hack = (bufmax - bufmin) >> 2;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2673

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2674 /* Check if the position is closer to PT or ZV than to the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2675 end of the known region. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2676

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2677 if (diffpt < 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2678 diffpt = -diffpt;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2679 if (diffzv < 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2680 diffzv = -diffzv;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2681

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2682 /* But also implement a heuristic that favors the known region

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2683 over PT or ZV. The reason for this is that switching to

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2684 PT or ZV will wipe out the knowledge in the known region,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2685 which might be annoying if the known region is large and

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2686 PT or ZV is not that much closer than the end of the known

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2687 region. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2688

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2689 diffzv += heuristic_hack;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2690 diffpt += heuristic_hack;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2691 if (diffpt < diffmax && diffpt <= diffzv)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2692 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2693 bufmax = bufmin = BUF_PT (buf);

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2694 bytmax = bytmin = BYTE_BUF_PT (buf);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2695 /* We set the size to 1 even though it doesn't really

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2696 matter because the new known region contains no

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2697 characters. We do this because this is the most

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2698 likely size of the characters around the new known

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2699 region, and we avoid potential yuckiness that is

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2700 done when size == 3. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2701 size = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2702 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2703 if (diffzv < diffmax)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2704 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2705 bufmax = bufmin = BUF_ZV (buf);

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2706 bytmax = bytmin = BYTE_BUF_ZV (buf);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2707 size = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2708 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2709 }

800

a5954632b187 [xemacs-hg @ 2002-03-31 08:27:14 by ben]

ben

parents: 793

diff changeset

2710 #ifdef ERROR_CHECK_TEXT

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2711 else if (x >= bufmin)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2713 #endif

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2714 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2715 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2716 Charbpos diffmin = bufmin - x;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2717 Charbpos diffpt = BUF_PT (buf) - x;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2718 Charbpos diffbegv = x - BUF_BEGV (buf);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2719 /* #### This value could stand some more exploration. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2720 Charcount heuristic_hack = (bufmax - bufmin) >> 2;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2721

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2722 if (diffpt < 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2723 diffpt = -diffpt;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2724 if (diffbegv < 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2725 diffbegv = -diffbegv;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2726

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2727 /* But also implement a heuristic that favors the known region --

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2728 see above. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2729

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2730 diffbegv += heuristic_hack;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2731 diffpt += heuristic_hack;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2732

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2733 if (diffpt < diffmin && diffpt <= diffbegv)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2734 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2735 bufmax = bufmin = BUF_PT (buf);

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2736 bytmax = bytmin = BYTE_BUF_PT (buf);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2737 /* We set the size to 1 even though it doesn't really

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2738 matter because the new known region contains no

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2739 characters. We do this because this is the most

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2740 likely size of the characters around the new known

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2741 region, and we avoid potential yuckiness that is

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2742 done when size == 3. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2743 size = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2744 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2745 if (diffbegv < diffmin)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2746 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2747 bufmax = bufmin = BUF_BEGV (buf);

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2748 bytmax = bytmin = BYTE_BUF_BEGV (buf);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2749 size = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2750 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2751 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2752

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2753 diff_so_far = x > bufmax ? x - bufmax : bufmin - x;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2754 if (diff_so_far > 50)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2755 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2756 /* If we have to move more than a certain amount, then look

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2757 into our cache. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2758 int minval = INT_MAX;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2759 int found = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2760 int i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2761

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2762 add_to_cache = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2763 /* I considered keeping the positions ordered. This would speed

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2764 up this loop, but updating the cache would take longer, so

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2765 it doesn't seem like it would really matter. */

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2766 for (i = 0; i < NUM_CACHED_POSITIONS; i++)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2767 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2768 int diff = buf->text->mule_charbpos_cache[i] - x;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2769

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2770 if (diff < 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2771 diff = -diff;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2772 if (diff < minval)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2773 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2774 minval = diff;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2775 found = i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2776 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2777 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2778

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2779 if (minval < diff_so_far)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2780 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2781 bufmax = bufmin = buf->text->mule_charbpos_cache[found];

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2782 bytmax = bytmin = buf->text->mule_bytebpos_cache[found];

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2783 size = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2784 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2785 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2786

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2787 /* It's conceivable that the caching above could lead to X being

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2788 the same as one of the range edges. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2789 if (x >= bufmax)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2790 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2791 Bytebpos newmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2792 Bytecount newsize;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2793

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2794 forward_p = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2795 while (x > bufmax)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2796 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2797 newmax = bytmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2798

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2799 INC_BYTEBPOS (buf, newmax);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2800 newsize = newmax - bytmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2801 if (newsize != size)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2802 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2803 bufmin = bufmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2804 bytmin = bytmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2805 size = newsize;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2806 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2807 bytmax = newmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2808 bufmax++;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2809 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2810 retval = bytmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2811

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2812 /* #### Should go past the found location to reduce the number

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2813 of times that this function is called */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2814 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2815 else /* x < bufmin */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2816 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2817 Bytebpos newmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2818 Bytecount newsize;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2819

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2820 forward_p = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2821 while (x < bufmin)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2822 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2823 newmin = bytmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2824

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2825 DEC_BYTEBPOS (buf, newmin);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2826 newsize = bytmin - newmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2827 if (newsize != size)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2828 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2829 bufmax = bufmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2830 bytmax = bytmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2831 size = newsize;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2832 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2833 bytmin = newmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2834 bufmin--;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2835 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2836 retval = bytmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2837

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2838 /* #### Should go past the found location to reduce the number

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2839 of times that this function is called

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2840 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2841 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2842

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2843 /* If size is three, than we have to max sure that the range we

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2844 discovered isn't too large, because we use a fixed-length

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2845 table to divide by 3. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2846

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2847 if (size == 3)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2848 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2849 int gap = bytmax - bytmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2850 buf->text->mule_three_p = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2851 buf->text->mule_shifter = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2852

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2853 if (gap > MAX_BYTEBPOS_GAP_SIZE_3)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2854 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2855 if (forward_p)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2856 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2857 bytmin = bytmax - MAX_BYTEBPOS_GAP_SIZE_3;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2858 bufmin = bufmax - MAX_CHARBPOS_GAP_SIZE_3;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2859 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2860 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2861 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2862 bytmax = bytmin + MAX_BYTEBPOS_GAP_SIZE_3;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2863 bufmax = bufmin + MAX_CHARBPOS_GAP_SIZE_3;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2864 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2865 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2866 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2867 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2868 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2869 buf->text->mule_three_p = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2870 if (size == 4)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2871 buf->text->mule_shifter = 2;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2872 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2873 buf->text->mule_shifter = size - 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2874 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2875

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2876 buf->text->mule_bufmin = bufmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2877 buf->text->mule_bufmax = bufmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2878 buf->text->mule_bytmin = bytmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2879 buf->text->mule_bytmax = bytmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2880

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2881 if (add_to_cache)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2882 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2883 int replace_loc;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2884

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2885 /* We throw away a "random" cached value and replace it with

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2886 the new value. It doesn't actually have to be very random

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2887 at all, just evenly distributed.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2888

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2889 #### It would be better to use a least-recently-used algorithm

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2890 or something that tries to space things out, but I'm not sure

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2891 it's worth it to go to the trouble of maintaining that. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2892 not_very_random_number += 621;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2893 replace_loc = not_very_random_number & 15;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2894 buf->text->mule_charbpos_cache[replace_loc] = x;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2895 buf->text->mule_bytebpos_cache[replace_loc] = retval;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2896 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2897

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2898 #endif /* OLD_BYTE_CHAR */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2899

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2900 done:

1292

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

2901 PROFILE_RECORD_EXITING_SECTION (QSin_char_byte_conversion);

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

2902

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2903 return retval;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2904 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2905

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2906 #undef CONSIDER

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2907

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2908 /* bytepos_to_charpos returns the char position corresponding to BYTEPOS. */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2909

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2910 /* This macro is a subroutine of bytebpos_to_charbpos_func.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2911 It is used when BYTEPOS is actually the byte position. */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2912

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2913 #define CONSIDER(BYTEPOS, CHARPOS) \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2914 do \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2915 { \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2916 Bytebpos this_bytepos = (BYTEPOS); \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2917 int changed = 0; \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2918 \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2919 if (this_bytepos == x) \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2920 { \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2921 retval = (CHARPOS); \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2922 goto done; \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2923 } \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2924 else if (this_bytepos > x) \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2925 { \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2926 if (this_bytepos < best_above_byte) \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2927 { \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2928 best_above = (CHARPOS); \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2929 best_above_byte = this_bytepos; \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2930 changed = 1; \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2931 } \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2932 } \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2933 else if (this_bytepos > best_below_byte) \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2934 { \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2935 best_below = (CHARPOS); \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2936 best_below_byte = this_bytepos; \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2937 changed = 1; \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2938 } \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2939 \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2940 if (changed) \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2941 { \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2942 if (best_above - best_below == best_above_byte - best_below_byte) \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2943 { \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2944 retval = best_below + (x - best_below_byte); \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2945 goto done; \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2946 } \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2947 } \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2948 } \

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2949 while (0)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2950

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2951 /* The logic in this function is almost identical to the logic in

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2952 the previous function. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2953

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2954 Charbpos

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2955 bytebpos_to_charbpos_func (struct buffer *buf, Bytebpos x)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2956 {

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2957 #ifdef OLD_BYTE_CHAR

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2958 Charbpos bufmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2959 Charbpos bufmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2960 Bytebpos bytmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2961 Bytebpos bytmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2962 int size;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2963 int forward_p;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2964 int diff_so_far;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2965 int add_to_cache = 0;

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2966 #endif /* OLD_BYTE_CHAR */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2967

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2968 Charbpos best_above, best_above_byte;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2969 Bytebpos best_below, best_below_byte;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2970 int i;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2971 struct buffer_text *t;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2972 Charbpos retval;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2973

1292

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

2974 PROFILE_DECLARE ();

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

2975

1292

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

2976 PROFILE_RECORD_ENTERING_SECTION (QSin_char_byte_conversion);

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

2977

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2978 best_above = BUF_Z (buf);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2979 best_above_byte = BYTE_BUF_Z (buf);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2980

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2981 /* In this case, we simply have all one-byte characters. But this should

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2982 have been intercepted before, in bytebpos_to_charbpos(). */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2983 text_checking_assert (best_above != best_above_byte);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2984

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2985 best_below = BUF_BEG (buf);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2986 best_below_byte = BYTE_BUF_BEG (buf);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2987

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2988 CONSIDER (BYTE_BUF_PT (buf), BUF_PT (buf));

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2989 CONSIDER (BYTE_BUF_GPT (buf), BUF_GPT (buf));

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2990 CONSIDER (BYTE_BUF_BEGV (buf), BUF_BEGV (buf));

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2991 CONSIDER (BYTE_BUF_ZV (buf), BUF_ZV (buf));

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2992

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2993 t = buf->text;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2994 CONSIDER (t->cached_bytepos, t->cached_charpos);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2995

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2996 /* Check the most recently entered positions first */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2997

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2998 for (i = t->next_cache_pos - 1; i >= 0; i--)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

2999 {

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3000 CONSIDER (t->mule_bytebpos_cache[i], t->mule_charbpos_cache[i]);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3001

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3002 /* If we are down to a range of 50 chars,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3003 don't bother checking any other markers;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3004 scan the intervening chars directly now. */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3005 if (best_above - best_below < 50)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3006 break;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3007 }

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3008

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3009 /* We get here if we did not exactly hit one of the known places.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3010 We have one known above and one known below.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3011 Scan, counting characters, from whichever one is closer. */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3012

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3013 if (x - best_below_byte < best_above_byte - x)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3014 {

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3015 int record = x - best_below_byte > 5000;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3016

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3017 #ifdef OLD_LOOP /* old code */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3018 while (best_below_byte < x)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3019 {

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3020 best_below++;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3021 INC_BYTEBPOS (buf, best_below_byte);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3022 }

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3023 #else

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3024 text_checking_assert (BUF_FORMAT (buf) == FORMAT_DEFAULT);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3025 /* The gap should not occur between best_below and x, or we will be

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3026 screwed in using charcount_to_bytecount(). It should not be exactly

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3027 at x either, because we already should have caught that. */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3028 text_checking_assert

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3029 (BYTE_BUF_CEILING_OF_IGNORE_ACCESSIBLE (buf, best_below_byte) > x);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3030

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3031 /* Using bytecount_to_charcount() is potentially a lot faster than

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3032 a simple loop above using INC_BYTEBPOS(); see above.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3033 */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3034 best_below +=

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3035 bytecount_to_charcount

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3036 (BYTE_BUF_BYTE_ADDRESS (buf, best_below_byte), x - best_below_byte);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3037 best_below_byte = x;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3038 #endif

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3039

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3040 /* If this position is quite far from the nearest known position,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3041 cache the correspondence.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3042

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3043 NB FSF does this: "... by creating a marker here.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3044 It will last until the next GC."

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3045 */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3046

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3047 if (record)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3048 {

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3049 if (t->next_cache_pos == NUM_CACHED_POSITIONS)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3050 {

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3051 memmove (t->mule_charbpos_cache,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3052 t->mule_charbpos_cache + NUM_MOVED_POSITIONS,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3053 sizeof (Charbpos) *

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3054 (NUM_CACHED_POSITIONS - NUM_MOVED_POSITIONS));

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3055 memmove (t->mule_bytebpos_cache,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3056 t->mule_bytebpos_cache + NUM_MOVED_POSITIONS,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3057 sizeof (Bytebpos) *

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3058 (NUM_CACHED_POSITIONS - NUM_MOVED_POSITIONS));

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3059 t->next_cache_pos -= NUM_MOVED_POSITIONS;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3060 }

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3061 t->mule_charbpos_cache[t->next_cache_pos] = best_below;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3062 t->mule_bytebpos_cache[t->next_cache_pos] = best_below_byte;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3063 t->next_cache_pos++;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3064 }

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3065

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3066

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3067 t->cached_charpos = best_below;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3068 t->cached_bytepos = best_below_byte;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3069

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3070 retval = best_below;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3071 text_checking_assert (best_below_byte >= best_below);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3072 goto done;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3073 }

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3074 else

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3075 {

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3076 int record = best_above_byte - x > 5000;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3077

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3078 #ifdef OLD_LOOP /* old code */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3079 while (best_above_byte > x)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3080 {

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3081 best_above--;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3082 DEC_BYTEBPOS (buf, best_above_byte);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3083 }

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3084 #else

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3085 text_checking_assert (BUF_FORMAT (buf) == FORMAT_DEFAULT);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3086 /* The gap should not occur between best_above and x, or we will be

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3087 screwed in using bytecount_to_charcount_down(). It should not be

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3088 exactly at x either, because we already should have caught

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3089 that. */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3090 text_checking_assert

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3091 (BYTE_BUF_FLOOR_OF_IGNORE_ACCESSIBLE (buf, best_above_byte) < x);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3092

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3093 /* Using bytecount_to_charcount_down() is potentially a lot faster

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3094 than a simple loop using INC_BYTEBPOS(); see above. */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3095 best_above -=

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3096 bytecount_to_charcount_down

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3097 /* BYTE_BUF_BYTE_ADDRESS will return a value on the high side of the

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3098 gap if we are at the gap, which is the wrong side. So do the

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3099 following trick instead. */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3100 (BYTE_BUF_BYTE_ADDRESS_BEFORE (buf, best_above_byte) + 1,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3101 best_above_byte - x);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3102 best_above_byte = x;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3103 #endif

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3104

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3105

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3106 /* If this position is quite far from the nearest known position,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3107 cache the correspondence.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3108

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3109 NB FSF does this: "... by creating a marker here.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3110 It will last until the next GC."

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3111 */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3112 if (record)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3113 {

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3114 if (t->next_cache_pos == NUM_CACHED_POSITIONS)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3115 {

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3116 memmove (t->mule_charbpos_cache,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3117 t->mule_charbpos_cache + NUM_MOVED_POSITIONS,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3118 sizeof (Charbpos) *

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3119 (NUM_CACHED_POSITIONS - NUM_MOVED_POSITIONS));

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3120 memmove (t->mule_bytebpos_cache,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3121 t->mule_bytebpos_cache + NUM_MOVED_POSITIONS,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3122 sizeof (Bytebpos) *

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3123 (NUM_CACHED_POSITIONS - NUM_MOVED_POSITIONS));

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3124 t->next_cache_pos -= NUM_MOVED_POSITIONS;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3125 }

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3126 t->mule_charbpos_cache[t->next_cache_pos] = best_above;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3127 t->mule_bytebpos_cache[t->next_cache_pos] = best_above_byte;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3128 t->next_cache_pos++;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3129 }

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3130

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3131 t->cached_charpos = best_above;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3132 t->cached_bytepos = best_above_byte;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3133

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3134 retval = best_above;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3135 text_checking_assert (best_above_byte >= best_above);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3136 goto done;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3137 }

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3138

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3139 #ifdef OLD_BYTE_CHAR

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3140

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3141 bufmin = buf->text->mule_bufmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3142 bufmax = buf->text->mule_bufmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3143 bytmin = buf->text->mule_bytmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3144 bytmax = buf->text->mule_bytmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3145 size = (1 << buf->text->mule_shifter) + !!buf->text->mule_three_p;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3146

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3147 /* The basic idea here is that we shift the "known region" up or down

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3148 until it overlaps the specified position. We do this by moving

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3149 the upper bound of the known region up one character at a time,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3150 and moving the lower bound of the known region up as necessary

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3151 when the size of the character just seen changes.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3152

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3153 We optimize this, however, by first shifting the known region to

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3154 one of the cached points if it's close by. (We don't check BYTE_BEG or

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3155 BYTE_Z, even though they're cached; most of the time these will be the

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3156 same as BYTE_BEGV and BYTE_ZV, and when they're not, they're not likely

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3157 to be used.) */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3158

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3159 if (x > bytmax)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3160 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3161 Bytebpos diffmax = x - bytmax;

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3162 Bytebpos diffpt = x - BYTE_BUF_PT (buf);

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3163 Bytebpos diffzv = BYTE_BUF_ZV (buf) - x;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3164 /* #### This value could stand some more exploration. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3165 Bytecount heuristic_hack = (bytmax - bytmin) >> 2;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3166

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3167 /* Check if the position is closer to PT or ZV than to the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3168 end of the known region. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3169

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3170 if (diffpt < 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3171 diffpt = -diffpt;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3172 if (diffzv < 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3173 diffzv = -diffzv;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3174

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3175 /* But also implement a heuristic that favors the known region

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3176 over BYTE_PT or BYTE_ZV. The reason for this is that switching to

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3177 BYTE_PT or BYTE_ZV will wipe out the knowledge in the known region,

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3178 which might be annoying if the known region is large and

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3179 BYTE_PT or BYTE_ZV is not that much closer than the end of the known

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3180 region. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3181

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3182 diffzv += heuristic_hack;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3183 diffpt += heuristic_hack;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3184 if (diffpt < diffmax && diffpt <= diffzv)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3185 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3186 bufmax = bufmin = BUF_PT (buf);

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3187 bytmax = bytmin = BYTE_BUF_PT (buf);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3188 /* We set the size to 1 even though it doesn't really

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3189 matter because the new known region contains no

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3190 characters. We do this because this is the most

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3191 likely size of the characters around the new known

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3192 region, and we avoid potential yuckiness that is

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3193 done when size == 3. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3194 size = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3195 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3196 if (diffzv < diffmax)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3197 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3198 bufmax = bufmin = BUF_ZV (buf);

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3199 bytmax = bytmin = BYTE_BUF_ZV (buf);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3200 size = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3201 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3202 }

800

a5954632b187 [xemacs-hg @ 2002-03-31 08:27:14 by ben]

ben

parents: 793

diff changeset

3203 #ifdef ERROR_CHECK_TEXT

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3204 else if (x >= bytmin)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3206 #endif

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3207 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3208 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3209 Bytebpos diffmin = bytmin - x;

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3210 Bytebpos diffpt = BYTE_BUF_PT (buf) - x;

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3211 Bytebpos diffbegv = x - BYTE_BUF_BEGV (buf);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3212 /* #### This value could stand some more exploration. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3213 Bytecount heuristic_hack = (bytmax - bytmin) >> 2;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3214

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3215 if (diffpt < 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3216 diffpt = -diffpt;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3217 if (diffbegv < 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3218 diffbegv = -diffbegv;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3219

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3220 /* But also implement a heuristic that favors the known region --

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3221 see above. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3222

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3223 diffbegv += heuristic_hack;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3224 diffpt += heuristic_hack;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3225

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3226 if (diffpt < diffmin && diffpt <= diffbegv)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3227 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3228 bufmax = bufmin = BUF_PT (buf);

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3229 bytmax = bytmin = BYTE_BUF_PT (buf);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3230 /* We set the size to 1 even though it doesn't really

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3231 matter because the new known region contains no

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3232 characters. We do this because this is the most

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3233 likely size of the characters around the new known

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3234 region, and we avoid potential yuckiness that is

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3235 done when size == 3. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3236 size = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3237 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3238 if (diffbegv < diffmin)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3239 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3240 bufmax = bufmin = BUF_BEGV (buf);

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3241 bytmax = bytmin = BYTE_BUF_BEGV (buf);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3242 size = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3243 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3244 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3245

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3246 diff_so_far = x > bytmax ? x - bytmax : bytmin - x;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3247 if (diff_so_far > 50)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3248 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3249 /* If we have to move more than a certain amount, then look

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3250 into our cache. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3251 int minval = INT_MAX;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3252 int found = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3253 int i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3254

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3255 add_to_cache = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3256 /* I considered keeping the positions ordered. This would speed

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3257 up this loop, but updating the cache would take longer, so

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3258 it doesn't seem like it would really matter. */

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3259 for (i = 0; i < NUM_CACHED_POSITIONS; i++)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3260 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3261 int diff = buf->text->mule_bytebpos_cache[i] - x;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3262

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3263 if (diff < 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3264 diff = -diff;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3265 if (diff < minval)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3266 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3267 minval = diff;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3268 found = i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3269 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3270 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3271

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3272 if (minval < diff_so_far)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3273 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3274 bufmax = bufmin = buf->text->mule_charbpos_cache[found];

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3275 bytmax = bytmin = buf->text->mule_bytebpos_cache[found];

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3276 size = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3277 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3278 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3279

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3280 /* It's conceivable that the caching above could lead to X being

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3281 the same as one of the range edges. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3282 if (x >= bytmax)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3283 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3284 Bytebpos newmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3285 Bytecount newsize;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3286

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3287 forward_p = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3288 while (x > bytmax)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3289 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3290 newmax = bytmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3291

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3292 INC_BYTEBPOS (buf, newmax);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3293 newsize = newmax - bytmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3294 if (newsize != size)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3295 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3296 bufmin = bufmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3297 bytmin = bytmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3298 size = newsize;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3299 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3300 bytmax = newmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3301 bufmax++;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3302 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3303 retval = bufmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3304

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3305 /* #### Should go past the found location to reduce the number

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3306 of times that this function is called */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3307 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3308 else /* x <= bytmin */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3309 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3310 Bytebpos newmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3311 Bytecount newsize;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3312

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3313 forward_p = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3314 while (x < bytmin)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3315 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3316 newmin = bytmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3317

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3318 DEC_BYTEBPOS (buf, newmin);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3319 newsize = bytmin - newmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3320 if (newsize != size)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3321 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3322 bufmax = bufmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3323 bytmax = bytmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3324 size = newsize;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3325 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3326 bytmin = newmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3327 bufmin--;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3328 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3329 retval = bufmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3330

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3331 /* #### Should go past the found location to reduce the number

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3332 of times that this function is called

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3333 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3334 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3335

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3336 /* If size is three, than we have to max sure that the range we

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3337 discovered isn't too large, because we use a fixed-length

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3338 table to divide by 3. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3339

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3340 if (size == 3)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3341 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3342 int gap = bytmax - bytmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3343 buf->text->mule_three_p = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3344 buf->text->mule_shifter = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3345

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3346 if (gap > MAX_BYTEBPOS_GAP_SIZE_3)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3347 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3348 if (forward_p)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3349 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3350 bytmin = bytmax - MAX_BYTEBPOS_GAP_SIZE_3;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3351 bufmin = bufmax - MAX_CHARBPOS_GAP_SIZE_3;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3352 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3353 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3354 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3355 bytmax = bytmin + MAX_BYTEBPOS_GAP_SIZE_3;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3356 bufmax = bufmin + MAX_CHARBPOS_GAP_SIZE_3;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3357 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3358 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3359 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3360 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3361 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3362 buf->text->mule_three_p = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3363 if (size == 4)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3364 buf->text->mule_shifter = 2;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3365 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3366 buf->text->mule_shifter = size - 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3367 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3368

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3369 buf->text->mule_bufmin = bufmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3370 buf->text->mule_bufmax = bufmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3371 buf->text->mule_bytmin = bytmin;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3372 buf->text->mule_bytmax = bytmax;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3373

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3374 if (add_to_cache)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3375 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3376 int replace_loc;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3377

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3378 /* We throw away a "random" cached value and replace it with

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3379 the new value. It doesn't actually have to be very random

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3380 at all, just evenly distributed.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3381

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3382 #### It would be better to use a least-recently-used algorithm

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3383 or something that tries to space things out, but I'm not sure

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3384 it's worth it to go to the trouble of maintaining that. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3385 not_very_random_number += 621;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3386 replace_loc = not_very_random_number & 15;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3387 buf->text->mule_charbpos_cache[replace_loc] = retval;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3388 buf->text->mule_bytebpos_cache[replace_loc] = x;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3389 }

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3390 #endif /* OLD_BYTE_CHAR */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3391

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3392 done:

1292

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

3393 PROFILE_RECORD_EXITING_SECTION (QSin_char_byte_conversion);

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

3394

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3395 return retval;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3396 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3397

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3398 /* Text of length BYTELENGTH and CHARLENGTH (in different units)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3399 was inserted at charbpos START. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3400

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3401 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3402 buffer_mule_signal_inserted_region (struct buffer *buf, Charbpos start,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3403 Bytecount bytelength,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3404 Charcount charlength)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3405 {

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3406 #ifdef OLD_BYTE_CHAR

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3407 int size = (1 << buf->text->mule_shifter) + !!buf->text->mule_three_p;

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3408 #endif /* OLD_BYTE_CHAR */

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3409 int i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3410

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3411 /* Adjust the cache of known positions. */

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3412 for (i = 0; i < buf->text->next_cache_pos; i++)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3413 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3414

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3415 if (buf->text->mule_charbpos_cache[i] > start)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3416 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3417 buf->text->mule_charbpos_cache[i] += charlength;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3418 buf->text->mule_bytebpos_cache[i] += bytelength;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3419 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3420 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3421

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3422 /* Adjust the special cached position. */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3423

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3424 if (buf->text->cached_charpos > start)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3425 {

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3426 buf->text->cached_charpos += charlength;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3427 buf->text->cached_bytepos += bytelength;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3428 }

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3429

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3430 #ifdef OLD_BYTE_CHAR

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3431 if (start >= buf->text->mule_bufmax)

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3432 return;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3433

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3434 /* The insertion is either before the known region, in which case

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3435 it shoves it forward; or within the known region, in which case

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3436 it shoves the end forward. (But it may make the known region

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3437 inconsistent, so we may have to shorten it.) */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3438

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3439 if (start <= buf->text->mule_bufmin)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3440 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3441 buf->text->mule_bufmin += charlength;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3442 buf->text->mule_bufmax += charlength;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3443 buf->text->mule_bytmin += bytelength;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3444 buf->text->mule_bytmax += bytelength;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3445 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3446 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3447 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3448 Charbpos end = start + charlength;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3449 /* the insertion point divides the known region in two.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3450 Keep the longer half, at least, and expand into the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3451 inserted chunk as much as possible. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3452

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3453 if (start - buf->text->mule_bufmin > buf->text->mule_bufmax - start)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3454 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3455 Bytebpos bytestart = (buf->text->mule_bytmin

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3456 + size * (start - buf->text->mule_bufmin));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3457 Bytebpos bytenew;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3458

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3459 while (start < end)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3460 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3461 bytenew = bytestart;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3462 INC_BYTEBPOS (buf, bytenew);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3463 if (bytenew - bytestart != size)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3464 break;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3465 start++;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3466 bytestart = bytenew;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3467 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3468 if (start != end)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3469 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3470 buf->text->mule_bufmax = start;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3471 buf->text->mule_bytmax = bytestart;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3472 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3473 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3474 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3475 buf->text->mule_bufmax += charlength;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3476 buf->text->mule_bytmax += bytelength;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3477 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3478 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3479 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3480 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3481 Bytebpos byteend = (buf->text->mule_bytmin

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3482 + size * (start - buf->text->mule_bufmin)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3483 + bytelength);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3484 Bytebpos bytenew;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3485

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3486 buf->text->mule_bufmax += charlength;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3487 buf->text->mule_bytmax += bytelength;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3488

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3489 while (end > start)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3490 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3491 bytenew = byteend;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3492 DEC_BYTEBPOS (buf, bytenew);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3493 if (byteend - bytenew != size)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3494 break;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3495 end--;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3496 byteend = bytenew;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3497 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3498 if (start != end)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3499 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3500 buf->text->mule_bufmin = end;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3501 buf->text->mule_bytmin = byteend;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3502 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3503 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3504 }

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3505 #endif /* OLD_BYTE_CHAR */

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3506 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3507

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3508 /* Text from START to END (equivalent in Bytebpos's: from BYTE_START to

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3509 BYTE_END) was deleted. */

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3510

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3511 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3512 buffer_mule_signal_deleted_region (struct buffer *buf, Charbpos start,

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3513 Charbpos end, Bytebpos byte_start,

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3514 Bytebpos byte_end)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3515 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3516 int i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3517

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3518 /* Adjust the cache of known positions. */

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3519 for (i = 0; i < buf->text->next_cache_pos; i++)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3520 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3521 /* After the end; gets shoved backward */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3522 if (buf->text->mule_charbpos_cache[i] > end)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3523 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3524 buf->text->mule_charbpos_cache[i] -= end - start;

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3525 buf->text->mule_bytebpos_cache[i] -= byte_end - byte_start;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3526 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3527 /* In the range; moves to start of range */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3528 else if (buf->text->mule_charbpos_cache[i] > start)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3529 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3530 buf->text->mule_charbpos_cache[i] = start;

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3531 buf->text->mule_bytebpos_cache[i] = byte_start;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3532 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3533 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3534

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3535 /* Adjust the special cached position. */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3536

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3537 /* After the end; gets shoved backward */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3538 if (buf->text->cached_charpos > end)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3539 {

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3540 buf->text->cached_charpos -= end - start;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3541 buf->text->cached_bytepos -= byte_end - byte_start;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3542 }

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3543 /* In the range; moves to start of range */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3544 else if (buf->text->cached_charpos > start)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3545 {

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3546 buf->text->cached_charpos = start;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3547 buf->text->cached_bytepos = byte_start;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3548 }

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3549

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3550 #ifdef OLD_BYTE_CHAR

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3551 /* We don't care about any text after the end of the known region. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3552

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3553 end = min (end, buf->text->mule_bufmax);

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3554 byte_end = min (byte_end, buf->text->mule_bytmax);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3555 if (start >= end)

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3556 return;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3557

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3558 /* The end of the known region offsets by the total amount of deletion,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3559 since it's all before it. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3560

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3561 buf->text->mule_bufmax -= end - start;

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3562 buf->text->mule_bytmax -= byte_end - byte_start;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3563

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3564 /* Now we don't care about any text after the start of the known region. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3565

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3566 end = min (end, buf->text->mule_bufmin);

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3567 byte_end = min (byte_end, buf->text->mule_bytmin);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3568 if (start < end)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3569 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3570 buf->text->mule_bufmin -= end - start;

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3571 buf->text->mule_bytmin -= byte_end - byte_start;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3572 }

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

3573 #endif /* OLD_BYTE_CHAR */

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3574 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3575

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3576 #endif /* MULE */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3577

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3578

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3579 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3580 /* verifying buffer and string positions */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3581 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3582

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3583 /* Functions below are tagged with either _byte or _char indicating

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3584 whether they return byte or character positions. For a buffer,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3585 a character position is a "Charbpos" and a byte position is a "Bytebpos".

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3586 For strings, these are sometimes typed using "Charcount" and

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3587 "Bytecount". */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3588

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3589 /* Flags for the functions below are:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3590

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3591 GB_ALLOW_PAST_ACCESSIBLE

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3592

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3593 Allow positions to range over the entire buffer (BUF_BEG to BUF_Z),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3594 rather than just the accessible portion (BUF_BEGV to BUF_ZV).

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3595 For strings, this flag has no effect.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3596

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3597 GB_COERCE_RANGE

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3598

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3599 If the position is outside the allowable range, return the lower

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3600 or upper bound of the range, whichever is closer to the specified

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3601 position.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3602

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3603 GB_NO_ERROR_IF_BAD

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3604

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3605 If the position is outside the allowable range, return -1.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3606

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3607 GB_NEGATIVE_FROM_END

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3608

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3609 If a value is negative, treat it as an offset from the end.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3610 Only applies to strings.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3611

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3612 The following additional flags apply only to the functions

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3613 that return ranges:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3614

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3615 GB_ALLOW_NIL

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3616

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3617 Either or both positions can be nil. If FROM is nil,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3618 FROM_OUT will contain the lower bound of the allowed range.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3619 If TO is nil, TO_OUT will contain the upper bound of the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3620 allowed range.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3621

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3622 GB_CHECK_ORDER

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3623

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3624 FROM must contain the lower bound and TO the upper bound

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3625 of the range. If the positions are reversed, an error is

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3626 signalled.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3627

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3628 The following is a combination flag:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3629

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3630 GB_HISTORICAL_STRING_BEHAVIOR

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3631

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3632 Equivalent to (GB_NEGATIVE_FROM_END | GB_ALLOW_NIL).

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3633 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3634

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3635 /* Return a buffer position stored in a Lisp_Object. Full

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3636 error-checking is done on the position. Flags can be specified to

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3637 control the behavior of out-of-range values. The default behavior

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3638 is to require that the position is within the accessible part of

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3639 the buffer (BEGV and ZV), and to signal an error if the position is

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3640 out of range.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3641

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3642 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3643

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3644 Charbpos

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3645 get_buffer_pos_char (struct buffer *b, Lisp_Object pos, unsigned int flags)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3646 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3647 /* Does not GC */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3648 Charbpos ind;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3649 Charbpos min_allowed, max_allowed;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3650

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3651 CHECK_INT_COERCE_MARKER (pos);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3652 ind = XINT (pos);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3653 min_allowed = flags & GB_ALLOW_PAST_ACCESSIBLE ? BUF_BEG (b) : BUF_BEGV (b);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3654 max_allowed = flags & GB_ALLOW_PAST_ACCESSIBLE ? BUF_Z (b) : BUF_ZV (b);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3655

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3656 if (ind < min_allowed || ind > max_allowed)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3657 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3658 if (flags & GB_COERCE_RANGE)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3659 ind = ind < min_allowed ? min_allowed : max_allowed;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3660 else if (flags & GB_NO_ERROR_IF_BAD)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3661 ind = -1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3662 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3663 {

793

e38acbeb1cae [xemacs-hg @ 2002-03-29 04:46:17 by ben]

ben

parents: 788

diff changeset

3664 Lisp_Object buffer = wrap_buffer (b);

e38acbeb1cae [xemacs-hg @ 2002-03-29 04:46:17 by ben]

ben

parents: 788

diff changeset

3665

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3666 args_out_of_range (buffer, pos);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3667 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3668 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3669

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3670 return ind;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3671 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3672

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3673 Bytebpos

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3674 get_buffer_pos_byte (struct buffer *b, Lisp_Object pos, unsigned int flags)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3675 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3676 Charbpos bpos = get_buffer_pos_char (b, pos, flags);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3677 if (bpos < 0) /* could happen with GB_NO_ERROR_IF_BAD */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3678 return -1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3679 return charbpos_to_bytebpos (b, bpos);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3680 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3681

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3682 /* Return a pair of buffer positions representing a range of text,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3683 taken from a pair of Lisp_Objects. Full error-checking is

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3684 done on the positions. Flags can be specified to control the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3685 behavior of out-of-range values. The default behavior is to

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3686 allow the range bounds to be specified in either order

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3687 (however, FROM_OUT will always be the lower bound of the range

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3688 and TO_OUT the upper bound),to require that the positions

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3689 are within the accessible part of the buffer (BEGV and ZV),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3690 and to signal an error if the positions are out of range.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3691 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3692

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3693 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3694 get_buffer_range_char (struct buffer *b, Lisp_Object from, Lisp_Object to,

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3695 Charbpos *from_out, Charbpos *to_out,

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3696 unsigned int flags)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3697 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3698 /* Does not GC */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3699 Charbpos min_allowed, max_allowed;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3700

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3701 min_allowed = (flags & GB_ALLOW_PAST_ACCESSIBLE) ?

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3702 BUF_BEG (b) : BUF_BEGV (b);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3703 max_allowed = (flags & GB_ALLOW_PAST_ACCESSIBLE) ?

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3704 BUF_Z (b) : BUF_ZV (b);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3705

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3706 if (NILP (from) && (flags & GB_ALLOW_NIL))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3707 *from_out = min_allowed;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3708 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3709 *from_out = get_buffer_pos_char (b, from, flags | GB_NO_ERROR_IF_BAD);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3710

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3711 if (NILP (to) && (flags & GB_ALLOW_NIL))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3712 *to_out = max_allowed;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3713 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3714 *to_out = get_buffer_pos_char (b, to, flags | GB_NO_ERROR_IF_BAD);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3715

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3716 if ((*from_out < 0 || *to_out < 0) && !(flags & GB_NO_ERROR_IF_BAD))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3717 {

793

e38acbeb1cae [xemacs-hg @ 2002-03-29 04:46:17 by ben]

ben

parents: 788

diff changeset

3718 Lisp_Object buffer = wrap_buffer (b);

e38acbeb1cae [xemacs-hg @ 2002-03-29 04:46:17 by ben]

ben

parents: 788

diff changeset

3719

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3720 args_out_of_range_3 (buffer, from, to);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3721 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3722

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3723 if (*from_out >= 0 && *to_out >= 0 && *from_out > *to_out)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3724 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3725 if (flags & GB_CHECK_ORDER)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3726 invalid_argument_2 ("start greater than end", from, to);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3727 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3728 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3729 Charbpos temp = *from_out;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3730 *from_out = *to_out;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3731 *to_out = temp;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3732 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3733 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3734 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3735

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3736 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3737 get_buffer_range_byte (struct buffer *b, Lisp_Object from, Lisp_Object to,

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3738 Bytebpos *from_out, Bytebpos *to_out,

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3739 unsigned int flags)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3740 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3741 Charbpos s, e;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3742

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3743 get_buffer_range_char (b, from, to, &s, &e, flags);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3744 if (s >= 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3745 *from_out = charbpos_to_bytebpos (b, s);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3746 else /* could happen with GB_NO_ERROR_IF_BAD */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3747 *from_out = -1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3748 if (e >= 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3749 *to_out = charbpos_to_bytebpos (b, e);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3750 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3751 *to_out = -1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3752 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3753

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3754 static Charcount

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3755 get_string_pos_char_1 (Lisp_Object string, Lisp_Object pos, unsigned int flags,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3756 Charcount known_length)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3757 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3758 Charcount ccpos;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3759 Charcount min_allowed = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3760 Charcount max_allowed = known_length;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3761

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3762 /* Computation of KNOWN_LENGTH is potentially expensive so we pass

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3763 it in. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3764 CHECK_INT (pos);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3765 ccpos = XINT (pos);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3766 if (ccpos < 0 && flags & GB_NEGATIVE_FROM_END)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3767 ccpos += max_allowed;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3768

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3769 if (ccpos < min_allowed || ccpos > max_allowed)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3770 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3771 if (flags & GB_COERCE_RANGE)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3772 ccpos = ccpos < min_allowed ? min_allowed : max_allowed;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3773 else if (flags & GB_NO_ERROR_IF_BAD)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3774 ccpos = -1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3775 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3776 args_out_of_range (string, pos);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3777 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3778

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3779 return ccpos;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3780 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3781

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3782 Charcount

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3783 get_string_pos_char (Lisp_Object string, Lisp_Object pos, unsigned int flags)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3784 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3785 return get_string_pos_char_1 (string, pos, flags,

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3786 string_char_length (string));

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3787 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3788

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3789 Bytecount

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3790 get_string_pos_byte (Lisp_Object string, Lisp_Object pos, unsigned int flags)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3791 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3792 Charcount ccpos = get_string_pos_char (string, pos, flags);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3793 if (ccpos < 0) /* could happen with GB_NO_ERROR_IF_BAD */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3794 return -1;

793

e38acbeb1cae [xemacs-hg @ 2002-03-29 04:46:17 by ben]

ben

parents: 788

diff changeset

3795 return string_index_char_to_byte (string, ccpos);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3796 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3797

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3798 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3799 get_string_range_char (Lisp_Object string, Lisp_Object from, Lisp_Object to,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3800 Charcount *from_out, Charcount *to_out,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3801 unsigned int flags)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3802 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3803 Charcount min_allowed = 0;

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3804 Charcount max_allowed = string_char_length (string);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3805

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3806 if (NILP (from) && (flags & GB_ALLOW_NIL))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3807 *from_out = min_allowed;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3808 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3809 *from_out = get_string_pos_char_1 (string, from,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3810 flags | GB_NO_ERROR_IF_BAD,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3811 max_allowed);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3812

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3813 if (NILP (to) && (flags & GB_ALLOW_NIL))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3814 *to_out = max_allowed;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3815 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3816 *to_out = get_string_pos_char_1 (string, to,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3817 flags | GB_NO_ERROR_IF_BAD,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3818 max_allowed);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3819

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3820 if ((*from_out < 0 || *to_out < 0) && !(flags & GB_NO_ERROR_IF_BAD))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3821 args_out_of_range_3 (string, from, to);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3822

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3823 if (*from_out >= 0 && *to_out >= 0 && *from_out > *to_out)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3824 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3825 if (flags & GB_CHECK_ORDER)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3826 invalid_argument_2 ("start greater than end", from, to);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3827 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3828 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3829 Charbpos temp = *from_out;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3830 *from_out = *to_out;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3831 *to_out = temp;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3832 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3833 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3834 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3835

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3836 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3837 get_string_range_byte (Lisp_Object string, Lisp_Object from, Lisp_Object to,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3838 Bytecount *from_out, Bytecount *to_out,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3839 unsigned int flags)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3840 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3841 Charcount s, e;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3842

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3843 get_string_range_char (string, from, to, &s, &e, flags);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3844 if (s >= 0)

793

e38acbeb1cae [xemacs-hg @ 2002-03-29 04:46:17 by ben]

ben

parents: 788

diff changeset

3845 *from_out = string_index_char_to_byte (string, s);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3846 else /* could happen with GB_NO_ERROR_IF_BAD */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3847 *from_out = -1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3848 if (e >= 0)

793

e38acbeb1cae [xemacs-hg @ 2002-03-29 04:46:17 by ben]

ben

parents: 788

diff changeset

3849 *to_out = string_index_char_to_byte (string, e);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3850 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3851 *to_out = -1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3852

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3853 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3854

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3855 Charxpos

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3856 get_buffer_or_string_pos_char (Lisp_Object object, Lisp_Object pos,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3857 unsigned int flags)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3858 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3859 return STRINGP (object) ?

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3860 get_string_pos_char (object, pos, flags) :

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3861 get_buffer_pos_char (XBUFFER (object), pos, flags);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3862 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3863

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3864 Bytexpos

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3865 get_buffer_or_string_pos_byte (Lisp_Object object, Lisp_Object pos,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3866 unsigned int flags)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3867 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3868 return STRINGP (object) ?

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3869 get_string_pos_byte (object, pos, flags) :

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3870 get_buffer_pos_byte (XBUFFER (object), pos, flags);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3871 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3872

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3873 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3874 get_buffer_or_string_range_char (Lisp_Object object, Lisp_Object from,

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3875 Lisp_Object to, Charxpos *from_out,

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3876 Charxpos *to_out, unsigned int flags)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3877 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3878 if (STRINGP (object))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3879 get_string_range_char (object, from, to, from_out, to_out, flags);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3880 else

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3881 get_buffer_range_char (XBUFFER (object), from, to, from_out, to_out,

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3882 flags);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3883 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3884

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3885 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3886 get_buffer_or_string_range_byte (Lisp_Object object, Lisp_Object from,

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3887 Lisp_Object to, Bytexpos *from_out,

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3888 Bytexpos *to_out, unsigned int flags)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3889 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3890 if (STRINGP (object))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3891 get_string_range_byte (object, from, to, from_out, to_out, flags);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3892 else

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3893 get_buffer_range_byte (XBUFFER (object), from, to, from_out, to_out,

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3894 flags);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3895 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3896

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3897 Charxpos

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3898 buffer_or_string_accessible_begin_char (Lisp_Object object)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3899 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3900 return STRINGP (object) ? 0 : BUF_BEGV (XBUFFER (object));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3901 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3902

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3903 Charxpos

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3904 buffer_or_string_accessible_end_char (Lisp_Object object)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3905 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3906 return STRINGP (object) ?

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3907 string_char_length (object) : BUF_ZV (XBUFFER (object));

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3908 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3909

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3910 Bytexpos

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3911 buffer_or_string_accessible_begin_byte (Lisp_Object object)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3912 {

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3913 return STRINGP (object) ? 0 : BYTE_BUF_BEGV (XBUFFER (object));

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3914 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3915

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3916 Bytexpos

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3917 buffer_or_string_accessible_end_byte (Lisp_Object object)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3918 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3919 return STRINGP (object) ?

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3920 XSTRING_LENGTH (object) : BYTE_BUF_ZV (XBUFFER (object));

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3921 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3922

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3923 Charxpos

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3924 buffer_or_string_absolute_begin_char (Lisp_Object object)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3925 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3926 return STRINGP (object) ? 0 : BUF_BEG (XBUFFER (object));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3927 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3928

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3929 Charxpos

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3930 buffer_or_string_absolute_end_char (Lisp_Object object)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3931 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3932 return STRINGP (object) ?

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3933 string_char_length (object) : BUF_Z (XBUFFER (object));

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3934 }

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3935

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3936 Bytexpos

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3937 buffer_or_string_absolute_begin_byte (Lisp_Object object)

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3938 {

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3939 return STRINGP (object) ? 0 : BYTE_BUF_BEG (XBUFFER (object));

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3940 }

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3941

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3942 Bytexpos

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3943 buffer_or_string_absolute_end_byte (Lisp_Object object)

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3944 {

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3945 return STRINGP (object) ?

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3946 XSTRING_LENGTH (object) : BYTE_BUF_Z (XBUFFER (object));

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3947 }

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3948

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3949 Charbpos

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3950 charbpos_clip_to_bounds (Charbpos lower, Charbpos num, Charbpos upper)

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3951 {

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3952 return (num < lower ? lower :

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3953 num > upper ? upper :

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3954 num);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3955 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3956

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3957 Bytebpos

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3958 bytebpos_clip_to_bounds (Bytebpos lower, Bytebpos num, Bytebpos upper)

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3959 {

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3960 return (num < lower ? lower :

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3961 num > upper ? upper :

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3962 num);

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3963 }

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3964

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3965 Charxpos

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3966 charxpos_clip_to_bounds (Charxpos lower, Charxpos num, Charxpos upper)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3967 {

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3968 return (num < lower ? lower :

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3969 num > upper ? upper :

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3970 num);

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3971 }

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3972

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3973 Bytexpos

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3974 bytexpos_clip_to_bounds (Bytexpos lower, Bytexpos num, Bytexpos upper)

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3975 {

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3976 return (num < lower ? lower :

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3977 num > upper ? upper :

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3978 num);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3979 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3980

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3981 /* These could be implemented in terms of the get_buffer_or_string()

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3982 functions above, but those are complicated and handle lots of weird

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3983 cases stemming from uncertain external input. */

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3984

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3985 Charxpos

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3986 buffer_or_string_clip_to_accessible_char (Lisp_Object object, Charxpos pos)

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3987 {

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3988 return (charxpos_clip_to_bounds

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3989 (pos, buffer_or_string_accessible_begin_char (object),

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3990 buffer_or_string_accessible_end_char (object)));

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3991 }

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3992

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3993 Bytexpos

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3994 buffer_or_string_clip_to_accessible_byte (Lisp_Object object, Bytexpos pos)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

3995 {

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3996 return (bytexpos_clip_to_bounds

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3997 (pos, buffer_or_string_accessible_begin_byte (object),

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3998 buffer_or_string_accessible_end_byte (object)));

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3999 }

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

4000

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

4001 Charxpos

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

4002 buffer_or_string_clip_to_absolute_char (Lisp_Object object, Charxpos pos)

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

4003 {

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

4004 return (charxpos_clip_to_bounds

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

4005 (pos, buffer_or_string_absolute_begin_char (object),

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

4006 buffer_or_string_absolute_end_char (object)));

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

4007 }

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

4008

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

4009 Bytexpos

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

4010 buffer_or_string_clip_to_absolute_byte (Lisp_Object object, Bytexpos pos)

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

4011 {

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

4012 return (bytexpos_clip_to_bounds

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

4013 (pos, buffer_or_string_absolute_begin_byte (object),

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

4014 buffer_or_string_absolute_end_byte (object)));

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4015 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4016

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4017

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4018 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4019 /* Implement TO_EXTERNAL_FORMAT, TO_INTERNAL_FORMAT */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4020 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4021

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4022 typedef struct

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4023 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4024 Dynarr_declare (Ibyte_dynarr *);

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4025 } Ibyte_dynarr_dynarr;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4026

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4027 typedef struct

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4028 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4029 Dynarr_declare (Extbyte_dynarr *);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4030 } Extbyte_dynarr_dynarr;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4031

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4032 static Extbyte_dynarr_dynarr *conversion_out_dynarr_list;

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4033 static Ibyte_dynarr_dynarr *conversion_in_dynarr_list;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4034

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4035 static int dfc_convert_to_external_format_in_use;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4036 static int dfc_convert_to_internal_format_in_use;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4037

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4038 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4039 dfc_convert_to_external_format (dfc_conversion_type source_type,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4040 dfc_conversion_data *source,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4041 Lisp_Object coding_system,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4042 dfc_conversion_type sink_type,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4043 dfc_conversion_data *sink)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4044 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4045 /* It's guaranteed that many callers are not prepared for GC here,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4046 esp. given that this code conversion occurs in many very hidden

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4047 places. */

1292

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

4048 int count;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4049 Extbyte_dynarr *conversion_out_dynarr;

1292

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

4050 PROFILE_DECLARE ();

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

4051

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4052 assert (!inhibit_non_essential_conversion_operations);

1292

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

4053 PROFILE_RECORD_ENTERING_SECTION (QSin_internal_external_conversion);

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

4054

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

4055 count = begin_gc_forbidden ();

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4056

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4057 type_checking_assert

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4058 (((source_type == DFC_TYPE_DATA) ||

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4059 (source_type == DFC_TYPE_LISP_LSTREAM && LSTREAMP (source->lisp_object)) ||

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4060 (source_type == DFC_TYPE_LISP_STRING && STRINGP (source->lisp_object)))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4061 &&

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4062 ((sink_type == DFC_TYPE_DATA) ||

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4063 (sink_type == DFC_TYPE_LISP_LSTREAM && LSTREAMP (source->lisp_object))));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4064

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4065 if (Dynarr_length (conversion_out_dynarr_list) <=

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4066 dfc_convert_to_external_format_in_use)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4067 Dynarr_add (conversion_out_dynarr_list, Dynarr_new (Extbyte));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4068 conversion_out_dynarr = Dynarr_at (conversion_out_dynarr_list,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4069 dfc_convert_to_external_format_in_use);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4070 Dynarr_reset (conversion_out_dynarr);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4071

853

2b6fa2618f76 [xemacs-hg @ 2002-05-28 08:44:22 by ben]

ben

parents: 851

diff changeset

4072 internal_bind_int (&dfc_convert_to_external_format_in_use,

2b6fa2618f76 [xemacs-hg @ 2002-05-28 08:44:22 by ben]

ben

parents: 851

diff changeset

4073 dfc_convert_to_external_format_in_use + 1);

2b6fa2618f76 [xemacs-hg @ 2002-05-28 08:44:22 by ben]

ben

parents: 851

diff changeset

4074

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4075 coding_system = get_coding_system_for_text_file (coding_system, 0);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4076

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4077 /* Here we optimize in the case where the coding system does no

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4078 conversion. However, we don't want to optimize in case the source

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4079 or sink is an lstream, since writing to an lstream can cause a

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4080 garbage collection, and this could be problematic if the source

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4081 is a lisp string. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4082 if (source_type != DFC_TYPE_LISP_LSTREAM &&

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4083 sink_type != DFC_TYPE_LISP_LSTREAM &&

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4084 coding_system_is_binary (coding_system))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4085 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4086 const Ibyte *ptr;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4087 Bytecount len;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4088

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4089 if (source_type == DFC_TYPE_LISP_STRING)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4090 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4091 ptr = XSTRING_DATA (source->lisp_object);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4092 len = XSTRING_LENGTH (source->lisp_object);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4093 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4094 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4095 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4096 ptr = (Ibyte *) source->data.ptr;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4097 len = source->data.len;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4098 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4099

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4100 #ifdef MULE

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4101 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4102 const Ibyte *end;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4103 for (end = ptr + len; ptr < end;)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4104 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4105 Ibyte c =

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

4106 (byte_ascii_p (*ptr)) ? *ptr :

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4107 (*ptr == LEADING_BYTE_CONTROL_1) ? (*(ptr+1) - 0x20) :

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4108 (*ptr == LEADING_BYTE_LATIN_ISO8859_1) ? (*(ptr+1)) :

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4109 '~';

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4110

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4111 Dynarr_add (conversion_out_dynarr, (Extbyte) c);

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4112 INC_IBYTEPTR (ptr);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4113 }

800

a5954632b187 [xemacs-hg @ 2002-03-31 08:27:14 by ben]

ben

parents: 793

diff changeset

4114 text_checking_assert (ptr == end);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4115 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4116 #else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4117 Dynarr_add_many (conversion_out_dynarr, ptr, len);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4118 #endif

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4119

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4120 }

1315

70921960b980 [xemacs-hg @ 2003-02-20 08:19:28 by ben]

ben

parents: 1292

diff changeset

4121 #ifdef WIN32_ANY

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4122 /* Optimize the common case involving Unicode where only ASCII is involved */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4123 else if (source_type != DFC_TYPE_LISP_LSTREAM &&

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4124 sink_type != DFC_TYPE_LISP_LSTREAM &&

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4125 dfc_coding_system_is_unicode (coding_system))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4126 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4127 const Ibyte *ptr, *p;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4128 Bytecount len;

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4129 const Ibyte *end;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4130

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4131 if (source_type == DFC_TYPE_LISP_STRING)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4132 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4133 ptr = XSTRING_DATA (source->lisp_object);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4134 len = XSTRING_LENGTH (source->lisp_object);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4135 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4136 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4137 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4138 ptr = (Ibyte *) source->data.ptr;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4139 len = source->data.len;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4140 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4141 end = ptr + len;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4142

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4143 for (p = ptr; p < end; p++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4144 {

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

4145 if (!byte_ascii_p (*p))

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4146 goto the_hard_way;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4147 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4148

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4149 for (p = ptr; p < end; p++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4150 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4151 Dynarr_add (conversion_out_dynarr, (Extbyte) (*p));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4152 Dynarr_add (conversion_out_dynarr, (Extbyte) '\0');

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4153 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4154 }

1315

70921960b980 [xemacs-hg @ 2003-02-20 08:19:28 by ben]

ben

parents: 1292

diff changeset

4155 #endif /* WIN32_ANY */

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4156 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4157 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4158 Lisp_Object streams_to_delete[3];

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4159 int delete_count;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4160 Lisp_Object instream, outstream;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4161 Lstream *reader, *writer;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4162

1315

70921960b980 [xemacs-hg @ 2003-02-20 08:19:28 by ben]

ben

parents: 1292

diff changeset

4163 #ifdef WIN32_ANY

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4164 the_hard_way:

1315

70921960b980 [xemacs-hg @ 2003-02-20 08:19:28 by ben]

ben

parents: 1292

diff changeset

4165 #endif /* WIN32_ANY */

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4166 delete_count = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4167 if (source_type == DFC_TYPE_LISP_LSTREAM)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4168 instream = source->lisp_object;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4169 else if (source_type == DFC_TYPE_DATA)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4170 streams_to_delete[delete_count++] = instream =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4171 make_fixed_buffer_input_stream (source->data.ptr, source->data.len);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4172 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4173 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4174 type_checking_assert (source_type == DFC_TYPE_LISP_STRING);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4175 streams_to_delete[delete_count++] = instream =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4176 /* This will GCPRO the Lisp string */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4177 make_lisp_string_input_stream (source->lisp_object, 0, -1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4178 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4179

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4180 if (sink_type == DFC_TYPE_LISP_LSTREAM)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4181 outstream = sink->lisp_object;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4182 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4183 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4184 type_checking_assert (sink_type == DFC_TYPE_DATA);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4185 streams_to_delete[delete_count++] = outstream =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4186 make_dynarr_output_stream

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4187 ((unsigned_char_dynarr *) conversion_out_dynarr);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4188 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4189

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4190 streams_to_delete[delete_count++] = outstream =

800

a5954632b187 [xemacs-hg @ 2002-03-31 08:27:14 by ben]

ben

parents: 793

diff changeset

4191 make_coding_output_stream (XLSTREAM (outstream), coding_system,

a5954632b187 [xemacs-hg @ 2002-03-31 08:27:14 by ben]

ben

parents: 793

diff changeset

4192 CODING_ENCODE, 0);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4193

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4194 reader = XLSTREAM (instream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4195 writer = XLSTREAM (outstream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4196 /* decoding_stream will gc-protect outstream */

1204

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4197 {

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4198 struct gcpro gcpro1, gcpro2;

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4199 GCPRO2 (instream, outstream);

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4200

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4201 while (1)

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4202 {

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4203 Bytecount size_in_bytes;

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4204 char tempbuf[1024]; /* some random amount */

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4205

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4206 size_in_bytes = Lstream_read (reader, tempbuf, sizeof (tempbuf));

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4207

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4208 if (size_in_bytes == 0)

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4209 break;

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4210 else if (size_in_bytes < 0)

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4211 signal_error (Qtext_conversion_error,

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4212 "Error converting to external format", Qunbound);

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4213

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4214 if (Lstream_write (writer, tempbuf, size_in_bytes) < 0)

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4215 signal_error (Qtext_conversion_error,

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4216 "Error converting to external format", Qunbound);

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4217 }

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4218

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4219 /* Closing writer will close any stream at the other end of writer. */

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4220 Lstream_close (writer);

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4221 Lstream_close (reader);

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4222 UNGCPRO;

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4223 }

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4224

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4225 /* The idea is that this function will create no garbage. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4226 while (delete_count)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4227 Lstream_delete (XLSTREAM (streams_to_delete [--delete_count]));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4228 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4229

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4230 unbind_to (count);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4231

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4232 if (sink_type != DFC_TYPE_LISP_LSTREAM)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4233 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4234 sink->data.len = Dynarr_length (conversion_out_dynarr);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4235 /* double zero-extend because we may be dealing with Unicode data */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4236 Dynarr_add (conversion_out_dynarr, '\0');

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4237 Dynarr_add (conversion_out_dynarr, '\0');

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4238 sink->data.ptr = Dynarr_atp (conversion_out_dynarr, 0);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4239 }

1292

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

4240

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

4241 PROFILE_RECORD_EXITING_SECTION (QSin_internal_external_conversion);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4242 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4243

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4244 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4245 dfc_convert_to_internal_format (dfc_conversion_type source_type,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4246 dfc_conversion_data *source,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4247 Lisp_Object coding_system,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4248 dfc_conversion_type sink_type,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4249 dfc_conversion_data *sink)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4250 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4251 /* It's guaranteed that many callers are not prepared for GC here,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4252 esp. given that this code conversion occurs in many very hidden

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4253 places. */

1292

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

4254 int count;

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4255 Ibyte_dynarr *conversion_in_dynarr;

2421

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4256 Lisp_Object underlying_cs;

1292

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

4257 PROFILE_DECLARE ();

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

4258

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4259 assert (!inhibit_non_essential_conversion_operations);

1292

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

4260 PROFILE_RECORD_ENTERING_SECTION (QSin_internal_external_conversion);

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

4261

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

4262 count = begin_gc_forbidden ();

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4263

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4264 type_checking_assert

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4265 ((source_type == DFC_TYPE_DATA ||

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4266 source_type == DFC_TYPE_LISP_LSTREAM)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4267 &&

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4268 (sink_type == DFC_TYPE_DATA ||

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4269 sink_type == DFC_TYPE_LISP_LSTREAM));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4270

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4271 if (Dynarr_length (conversion_in_dynarr_list) <=

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4272 dfc_convert_to_internal_format_in_use)

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4273 Dynarr_add (conversion_in_dynarr_list, Dynarr_new (Ibyte));

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4274 conversion_in_dynarr = Dynarr_at (conversion_in_dynarr_list,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4275 dfc_convert_to_internal_format_in_use);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4276 Dynarr_reset (conversion_in_dynarr);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4277

853

2b6fa2618f76 [xemacs-hg @ 2002-05-28 08:44:22 by ben]

ben

parents: 851

diff changeset

4278 internal_bind_int (&dfc_convert_to_internal_format_in_use,

2b6fa2618f76 [xemacs-hg @ 2002-05-28 08:44:22 by ben]

ben

parents: 851

diff changeset

4279 dfc_convert_to_internal_format_in_use + 1);

2b6fa2618f76 [xemacs-hg @ 2002-05-28 08:44:22 by ben]

ben

parents: 851

diff changeset

4280

2421

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4281 /* The second call does the equivalent of both calls, but we need

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4282 the result after the first call (which wraps just a to-text

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4283 converter) as well as the result after the second call (which

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4284 also wraps an EOL-detection converter). */

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4285 underlying_cs = get_coding_system_for_text_file (coding_system, 0);

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4286 coding_system = get_coding_system_for_text_file (underlying_cs, 1);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4287

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4288 if (source_type != DFC_TYPE_LISP_LSTREAM &&

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4289 sink_type != DFC_TYPE_LISP_LSTREAM &&

2421

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4290 coding_system_is_binary (underlying_cs))

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4291 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4292 #ifdef MULE

2421

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4293 const Ibyte *ptr;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4294 Bytecount len = source->data.len;

2421

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4295 const Ibyte *end;

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4296

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4297 /* Make sure no EOL conversion is needed. With a little work we

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4298 could handle EOL conversion as well but it may not be needed as an

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4299 optimization. */

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4300 if (!EQ (coding_system, underlying_cs))

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4301 {

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4302 for (ptr = (const Ibyte *) source->data.ptr, end = ptr + len;

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4303 ptr < end; ptr++)

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4304 {

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4305 if (*ptr == '\r' || *ptr == '\n')

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4306 goto the_hard_way;

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4307 }

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4308 }

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4309

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4310 for (ptr = (const Ibyte *) source->data.ptr, end = ptr + len;

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4311 ptr < end; ptr++)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4312 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4313 Ibyte c = *ptr;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4314

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

4315 if (byte_ascii_p (c))

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4316 Dynarr_add (conversion_in_dynarr, c);

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

4317 else if (byte_c1_p (c))

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4318 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4319 Dynarr_add (conversion_in_dynarr, LEADING_BYTE_CONTROL_1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4320 Dynarr_add (conversion_in_dynarr, c + 0x20);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4321 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4322 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4323 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4324 Dynarr_add (conversion_in_dynarr, LEADING_BYTE_LATIN_ISO8859_1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4325 Dynarr_add (conversion_in_dynarr, c);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4326 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4327 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4328 #else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4329 Dynarr_add_many (conversion_in_dynarr, source->data.ptr, source->data.len);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4330 #endif

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4331 }

1315

70921960b980 [xemacs-hg @ 2003-02-20 08:19:28 by ben]

ben

parents: 1292

diff changeset

4332 #ifdef WIN32_ANY

1292

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

4333 /* Optimize the common case involving Unicode where only ASCII/Latin-1 is

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

4334 involved */

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4335 else if (source_type != DFC_TYPE_LISP_LSTREAM &&

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4336 sink_type != DFC_TYPE_LISP_LSTREAM &&

2421

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4337 dfc_coding_system_is_unicode (underlying_cs))

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4338 {

2421

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4339 const Ibyte *ptr;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4340 Bytecount len = source->data.len;

2421

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4341 const Ibyte *end;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4342

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4343 if (len & 1)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4344 goto the_hard_way;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4345

2421

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4346 /* Make sure only ASCII/Latin-1 is involved */

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4347 for (ptr = (const Ibyte *) source->data.ptr + 1, end = ptr + len;

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4348 ptr < end; ptr += 2)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4349 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4350 if (*ptr)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4351 goto the_hard_way;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4352 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4353

2421

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4354 /* Make sure no EOL conversion is needed. With a little work we

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4355 could handle EOL conversion as well but it may not be needed as an

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4356 optimization. */

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4357 if (!EQ (coding_system, underlying_cs))

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4358 {

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4359 for (ptr = (const Ibyte *) source->data.ptr, end = ptr + len;

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4360 ptr < end; ptr += 2)

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4361 {

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4362 if (*ptr == '\r' || *ptr == '\n')

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4363 goto the_hard_way;

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4364 }

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4365 }

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4366

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4367 for (ptr = (const Ibyte *) source->data.ptr, end = ptr + len;

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4368 ptr < end; ptr += 2)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4369 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4370 Ibyte c = *ptr;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4371

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

4372 if (byte_ascii_p (c))

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4373 Dynarr_add (conversion_in_dynarr, c);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4374 #ifdef MULE

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

4375 else if (byte_c1_p (c))

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4376 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4377 Dynarr_add (conversion_in_dynarr, LEADING_BYTE_CONTROL_1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4378 Dynarr_add (conversion_in_dynarr, c + 0x20);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4379 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4380 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4381 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4382 Dynarr_add (conversion_in_dynarr, LEADING_BYTE_LATIN_ISO8859_1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4383 Dynarr_add (conversion_in_dynarr, c);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4384 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4385 #endif /* MULE */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4386 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4387 }

1315

70921960b980 [xemacs-hg @ 2003-02-20 08:19:28 by ben]

ben

parents: 1292

diff changeset

4388 #endif /* WIN32_ANY */

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4389 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4390 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4391 Lisp_Object streams_to_delete[3];

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4392 int delete_count;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4393 Lisp_Object instream, outstream;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4394 Lstream *reader, *writer;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4395

2421

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4396 #if defined (WIN32_ANY) || defined (MULE)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4397 the_hard_way:

2421

ab71ad6ff3dd [xemacs-hg @ 2004-12-06 03:50:53 by ben]

ben

parents: 2385

diff changeset

4398 #endif

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4399 delete_count = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4400 if (source_type == DFC_TYPE_LISP_LSTREAM)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4401 instream = source->lisp_object;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4402 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4403 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4404 type_checking_assert (source_type == DFC_TYPE_DATA);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4405 streams_to_delete[delete_count++] = instream =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4406 make_fixed_buffer_input_stream (source->data.ptr, source->data.len);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4407 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4408

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4409 if (sink_type == DFC_TYPE_LISP_LSTREAM)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4410 outstream = sink->lisp_object;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4411 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4412 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4413 type_checking_assert (sink_type == DFC_TYPE_DATA);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4414 streams_to_delete[delete_count++] = outstream =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4415 make_dynarr_output_stream

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4416 ((unsigned_char_dynarr *) conversion_in_dynarr);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4417 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4418

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4419 streams_to_delete[delete_count++] = outstream =

800

a5954632b187 [xemacs-hg @ 2002-03-31 08:27:14 by ben]

ben

parents: 793

diff changeset

4420 make_coding_output_stream (XLSTREAM (outstream), coding_system,

a5954632b187 [xemacs-hg @ 2002-03-31 08:27:14 by ben]

ben

parents: 793

diff changeset

4421 CODING_DECODE, 0);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4422

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4423 reader = XLSTREAM (instream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4424 writer = XLSTREAM (outstream);

1204

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4425 {

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4426 struct gcpro gcpro1, gcpro2;

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4427 /* outstream will gc-protect its sink stream, if necessary */

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4428 GCPRO2 (instream, outstream);

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4429

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4430 while (1)

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4431 {

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4432 Bytecount size_in_bytes;

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4433 char tempbuf[1024]; /* some random amount */

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4434

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4435 size_in_bytes = Lstream_read (reader, tempbuf, sizeof (tempbuf));

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4436

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4437 if (size_in_bytes == 0)

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4438 break;

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4439 else if (size_in_bytes < 0)

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4440 signal_error (Qtext_conversion_error,

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4441 "Error converting to internal format", Qunbound);

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4442

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4443 if (Lstream_write (writer, tempbuf, size_in_bytes) < 0)

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4444 signal_error (Qtext_conversion_error,

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4445 "Error converting to internal format", Qunbound);

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4446 }

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4447

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4448 /* Closing writer will close any stream at the other end of writer. */

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4449 Lstream_close (writer);

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4450 Lstream_close (reader);

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4451 UNGCPRO;

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

4452 }

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4453

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4454 /* The idea is that this function will create no garbage. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4455 while (delete_count)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4456 Lstream_delete (XLSTREAM (streams_to_delete [--delete_count]));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4457 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4458

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4459 unbind_to (count);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4460

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4461 if (sink_type != DFC_TYPE_LISP_LSTREAM)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4462 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4463 sink->data.len = Dynarr_length (conversion_in_dynarr);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4464 Dynarr_add (conversion_in_dynarr, '\0'); /* remember to NUL-terminate! */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4465 /* The macros don't currently distinguish between internal and

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4466 external sinks, and allocate and copy two extra bytes in both

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4467 cases. So we add a second zero, just like for external data

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4468 (in that case, because we may be converting to Unicode). */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4469 Dynarr_add (conversion_in_dynarr, '\0');

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4470 sink->data.ptr = Dynarr_atp (conversion_in_dynarr, 0);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4471 }

1292

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

4472

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

4473 PROFILE_RECORD_EXITING_SECTION (QSin_internal_external_conversion);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4474 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4475

1318

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4476 /* ----------------------------------------------------------------------- */

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4477 /* Alloca-conversion helpers */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4478 /* ----------------------------------------------------------------------- */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4479

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4480 /* For alloca(), things are trickier because the calling function needs to

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4481 allocate. This means that the caller needs to do the following:

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4482

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4483 (a) invoke us to do the conversion, remember the data and return the size.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4484 (b) alloca() the proper size.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4485 (c) invoke us again to copy the data.

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4486

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4487 We need to handle the possibility of two or more invocations of the

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4488 converter in the same expression. In such cases it's conceivable that

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4489 the evaluation of the sub-expressions will be overlapping (e.g. one size

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4490 function called, then the other one called, then the copy functions

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4491 called). To handle this, we keep a list of active data, indexed by the

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4492 src expression. (We use the stringize operator to avoid evaluating the

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4493 expression multiple times.) If the caller uses the exact same src

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4494 expression twice in two converter calls in the same subexpression, we

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4496 conceivably try to index on other parameters as well, but there is not

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4497 really any point. */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4498

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4499 alloca_convert_vals_dynarr *active_alloca_convert;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4500

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4501 int

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4502 find_pos_of_existing_active_alloca_convert (const char *srctext)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4503 {

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4504 alloca_convert_vals *vals = NULL;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4505 int i;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4506

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4507 if (!active_alloca_convert)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4508 active_alloca_convert = Dynarr_new (alloca_convert_vals);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4509

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4510 for (i = 0; i < Dynarr_length (active_alloca_convert); i++)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4511 {

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4512 vals = Dynarr_atp (active_alloca_convert, i);

2385

6b957313bd8e [xemacs-hg @ 2004-11-13 06:32:24 by ben]

ben

parents: 2367

diff changeset

4513 /* On my system, two different occurrences of the same stringized

6b957313bd8e [xemacs-hg @ 2004-11-13 06:32:24 by ben]

ben

parents: 2367

diff changeset

4514 argument always point to the same string. However, on someone

6b957313bd8e [xemacs-hg @ 2004-11-13 06:32:24 by ben]

ben

parents: 2367

diff changeset

4515 else's system, that wasn't the case. We check for equality

6b957313bd8e [xemacs-hg @ 2004-11-13 06:32:24 by ben]

ben

parents: 2367

diff changeset

4516 first, since it seems systems work my way more than the other

6b957313bd8e [xemacs-hg @ 2004-11-13 06:32:24 by ben]

ben

parents: 2367

diff changeset

4517 way. */

6b957313bd8e [xemacs-hg @ 2004-11-13 06:32:24 by ben]

ben

parents: 2367

diff changeset

4518 if (vals->srctext == srctext || !strcmp (vals->srctext, srctext))

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4519 return i;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4520 }

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4521

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4522 return -1;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4523 }

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4524

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4525 /* ----------------------------------------------------------------------- */

1318

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4526 /* New-style DFC converters (data is returned rather than stored into var) */

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4527 /* ----------------------------------------------------------------------- */

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4528

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4529 /* We handle here the cases where SRC is a Lisp_Object, internal data

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4530 (sized or unsized), or external data (sized or unsized), and return type

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4531 is unsized alloca() or malloc() data. If the return type is a

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4532 Lisp_Object, use build_ext_string() for unsized external data,

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4533 make_ext_string() for sized external data. If the return type needs to

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4534 be sized data, use the *_TO_SIZED_*() macros, and for other more

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4535 complicated cases, use the original TO_*_FORMAT() macros. */

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4536

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4537 static void

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4538 new_dfc_convert_now_damn_it (const void *src, Bytecount src_size,

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4539 enum new_dfc_src_type type,

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4540 void **dst, Bytecount *dst_size,

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4541 Lisp_Object codesys)

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4542 {

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4543 /* #### In the case of alloca(), it would be a bit more efficient, for

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4544 small strings, to use static Dynarr's like are used internally in

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4545 TO_*_FORMAT(), or some other way of avoiding malloc() followed by

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4546 free(). I doubt it really matters, though. */

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4547

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4548 switch (type)

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4549 {

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4550 case DFC_EXTERNAL:

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4551 TO_INTERNAL_FORMAT (C_STRING, src,

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4552 MALLOC, (*dst, *dst_size), codesys);

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4553 break;

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4554

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4555 case DFC_SIZED_EXTERNAL:

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4556 TO_INTERNAL_FORMAT (DATA, (src, src_size),

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4557 MALLOC, (*dst, *dst_size), codesys);

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4558 break;

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4559

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4560 case DFC_INTERNAL:

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4561 TO_EXTERNAL_FORMAT (C_STRING, src,

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4562 MALLOC, (*dst, *dst_size), codesys);

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4563 break;

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4564

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4565 case DFC_SIZED_INTERNAL:

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4566 TO_EXTERNAL_FORMAT (DATA, (src, src_size),

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4567 MALLOC, (*dst, *dst_size), codesys);

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4568 break;

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4569

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4570 case DFC_LISP_STRING:

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4571 TO_EXTERNAL_FORMAT (LISP_STRING, VOID_TO_LISP (src),

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4572 MALLOC, (*dst, *dst_size), codesys);

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4573 break;

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4574

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4575 default:

1318

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4577 }

2367

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4578

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4579 /* The size is always + 2 because we have double zero-termination at the

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4580 end of all data (for Unicode-correctness). */

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4581 *dst_size += 2;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4582 }

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4583

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4584 Bytecount

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4585 new_dfc_convert_size (const char *srctext, const void *src,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4586 Bytecount src_size, enum new_dfc_src_type type,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4587 Lisp_Object codesys)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4588 {

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4589 alloca_convert_vals vals;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4590

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4591 assert (find_pos_of_existing_active_alloca_convert (srctext) < 0);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4592

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4593 vals.srctext = srctext;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4594

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4595 new_dfc_convert_now_damn_it (src, src_size, type, &vals.dst, &vals.dst_size,

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4596 codesys);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4597

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4598 Dynarr_add (active_alloca_convert, vals);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4599 return vals.dst_size;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4600 }

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4601

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4602 void *

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4603 new_dfc_convert_copy_data (const char *srctext, void *alloca_data)

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4604 {

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4605 alloca_convert_vals *vals;

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4606 int i = find_pos_of_existing_active_alloca_convert (srctext);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4607

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4608 assert (i >= 0);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4609 vals = Dynarr_atp (active_alloca_convert, i);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4610 assert (alloca_data);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4611 memcpy (alloca_data, vals->dst, vals->dst_size);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4612 xfree (vals->dst, void *);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4613 Dynarr_delete (active_alloca_convert, i);

ecf1ebac70d8 [xemacs-hg @ 2004-11-04 23:05:23 by ben]

ben

parents: 2333

diff changeset

4614 return alloca_data;

1318

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4615 }

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4616

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4617 void *

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4618 new_dfc_convert_malloc (const void *src, Bytecount src_size,

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4619 enum new_dfc_src_type type, Lisp_Object codesys)

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4620 {

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4621 void *dst;

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4622 Bytecount dst_size;

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4623

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4624 new_dfc_convert_now_damn_it (src, src_size, type, &dst, &dst_size, codesys);

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4625 return dst;

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4626 }

b531bf8658e9 [xemacs-hg @ 2003-02-21 06:56:46 by ben]

ben

parents: 1315

diff changeset

4627

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4628

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4629 /************************************************************************/

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4630 /* Basic Ichar functions */

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4631 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4632

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4633 #ifdef MULE

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4634

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4635 /* Convert a non-ASCII Mule character C into a one-character Mule-encoded

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4636 string in STR. Returns the number of bytes stored.

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4637 Do not call this directly. Use the macro set_itext_ichar() instead.

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4638 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4639

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4640 Bytecount

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4641 non_ascii_set_itext_ichar (Ibyte *str, Ichar c)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4642 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4643 Ibyte *p;

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4644 Ibyte lb;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4645 int c1, c2;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4646 Lisp_Object charset;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4647

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4648 p = str;

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4649 BREAKUP_ICHAR (c, charset, c1, c2);

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4650 lb = ichar_leading_byte (c);

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

4651 if (leading_byte_private_p (lb))

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

4652 *p++ = private_leading_byte_prefix (lb);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4653 *p++ = lb;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4654 if (EQ (charset, Vcharset_control_1))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4655 c1 += 0x20;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4656 *p++ = c1 | 0x80;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4657 if (c2)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4658 *p++ = c2 | 0x80;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4659

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4660 return (p - str);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4661 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4662

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4663 /* Return the first character from a Mule-encoded string in STR,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4664 assuming it's non-ASCII. Do not call this directly.

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4665 Use the macro itext_ichar() instead. */

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4666

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4667 Ichar

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4668 non_ascii_itext_ichar (const Ibyte *str)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4669 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4670 Ibyte i0 = *str, i1, i2 = 0;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4671 Lisp_Object charset;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4672

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4673 if (i0 == LEADING_BYTE_CONTROL_1)

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4674 return (Ichar) (*++str - 0x20);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4675

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

4676 if (leading_byte_prefix_p (i0))

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4677 i0 = *++str;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4678

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4679 i1 = *++str & 0x7F;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4680

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

4681 charset = charset_by_leading_byte (i0);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4682 if (XCHARSET_DIMENSION (charset) == 2)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4683 i2 = *++str & 0x7F;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4684

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4685 return make_ichar (charset, i1, i2);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4686 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4687

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4688 /* Return whether CH is a valid Ichar, assuming it's non-ASCII.

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4689 Do not call this directly. Use the macro valid_ichar_p() instead. */

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4690

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4691 int

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4692 non_ascii_valid_ichar_p (Ichar ch)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4693 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4694 int f1, f2, f3;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4695

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4696 /* Must have only lowest 19 bits set */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4697 if (ch & ~0x7FFFF)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4698 return 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4699

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4700 f1 = ichar_field1 (ch);

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4701 f2 = ichar_field2 (ch);

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4702 f3 = ichar_field3 (ch);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4703

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4704 if (f1 == 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4705 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4706 /* dimension-1 char */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4707 Lisp_Object charset;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4708

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4709 /* leading byte must be correct */

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4710 if (f2 < MIN_ICHAR_FIELD2_OFFICIAL ||

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4711 (f2 > MAX_ICHAR_FIELD2_OFFICIAL && f2 < MIN_ICHAR_FIELD2_PRIVATE) ||

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4712 f2 > MAX_ICHAR_FIELD2_PRIVATE)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4713 return 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4714 /* octet not out of range */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4715 if (f3 < 0x20)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4716 return 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4717 /* charset exists */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4718 /*

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4719 NOTE: This takes advantage of the fact that

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4720 FIELD2_TO_OFFICIAL_LEADING_BYTE and

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4721 FIELD2_TO_PRIVATE_LEADING_BYTE are the same.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4722 */

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

4723 charset = charset_by_leading_byte (f2 + FIELD2_TO_OFFICIAL_LEADING_BYTE);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4724 if (EQ (charset, Qnil))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4725 return 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4726 /* check range as per size (94 or 96) of charset */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4727 return ((f3 > 0x20 && f3 < 0x7f) || XCHARSET_CHARS (charset) == 96);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4728 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4729 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4730 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4731 /* dimension-2 char */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4732 Lisp_Object charset;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4733

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4734 /* leading byte must be correct */

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4735 if (f1 < MIN_ICHAR_FIELD1_OFFICIAL ||

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4736 (f1 > MAX_ICHAR_FIELD1_OFFICIAL && f1 < MIN_ICHAR_FIELD1_PRIVATE) ||

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4737 f1 > MAX_ICHAR_FIELD1_PRIVATE)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4738 return 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4739 /* octets not out of range */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4740 if (f2 < 0x20 || f3 < 0x20)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4741 return 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4742

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4743 #ifdef ENABLE_COMPOSITE_CHARS

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4744 if (f1 + FIELD1_TO_OFFICIAL_LEADING_BYTE == LEADING_BYTE_COMPOSITE)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4745 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4746 if (UNBOUNDP (Fgethash (make_int (ch),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4747 Vcomposite_char_char2string_hash_table,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4748 Qunbound)))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4749 return 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4750 return 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4751 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4752 #endif /* ENABLE_COMPOSITE_CHARS */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4753

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4754 /* charset exists */

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4755 if (f1 <= MAX_ICHAR_FIELD1_OFFICIAL)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4756 charset =

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

4757 charset_by_leading_byte (f1 + FIELD1_TO_OFFICIAL_LEADING_BYTE);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4758 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4759 charset =

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

4760 charset_by_leading_byte (f1 + FIELD1_TO_PRIVATE_LEADING_BYTE);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4761

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4762 if (EQ (charset, Qnil))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4763 return 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4764 /* check range as per size (94x94 or 96x96) of charset */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4765 return ((f2 != 0x20 && f2 != 0x7F && f3 != 0x20 && f3 != 0x7F) ||

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4766 XCHARSET_CHARS (charset) == 96);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4767 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4768 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4769

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4770 /* Copy the character pointed to by SRC into DST. Do not call this

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4771 directly. Use the macro itext_copy_ichar() instead.

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4772 Return the number of bytes copied. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4773

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4774 Bytecount

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4775 non_ascii_itext_copy_ichar (const Ibyte *src, Ibyte *dst)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4776 {

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

4777 Bytecount bytes = rep_bytes_by_first_byte (*src);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4778 Bytecount i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4779 for (i = bytes; i; i--, dst++, src++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4780 *dst = *src;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4781 return bytes;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4782 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4783

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4784 #endif /* MULE */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4785

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4786

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4787 /************************************************************************/

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4788 /* streams of Ichars */

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4789 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4790

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4791 #ifdef MULE

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4792

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4793 /* Treat a stream as a stream of Ichar's rather than a stream of bytes.

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4794 The functions below are not meant to be called directly; use

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4795 the macros in insdel.h. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4796

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4797 Ichar

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4798 Lstream_get_ichar_1 (Lstream *stream, int ch)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4799 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4800 Ibyte str[MAX_ICHAR_LEN];

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4801 Ibyte *strptr = str;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4802 Bytecount bytes;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4803

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4804 str[0] = (Ibyte) ch;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4805

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

4806 for (bytes = rep_bytes_by_first_byte (ch) - 1; bytes; bytes--)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4807 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4808 int c = Lstream_getc (stream);

800

a5954632b187 [xemacs-hg @ 2002-03-31 08:27:14 by ben]

ben

parents: 793

diff changeset

4809 text_checking_assert (c >= 0);

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4810 *++strptr = (Ibyte) c;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4811 }

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4812 return itext_ichar (str);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4813 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4814

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4815 int

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4816 Lstream_fput_ichar (Lstream *stream, Ichar ch)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4817 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4818 Ibyte str[MAX_ICHAR_LEN];

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4819 Bytecount len = set_itext_ichar (str, ch);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4820 return Lstream_write (stream, str, len);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4821 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4822

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4823 void

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4824 Lstream_funget_ichar (Lstream *stream, Ichar ch)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4825 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4826 Ibyte str[MAX_ICHAR_LEN];

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4827 Bytecount len = set_itext_ichar (str, ch);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4828 Lstream_unread (stream, str, len);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4829 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4830

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4831 #endif /* MULE */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4832

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4833

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4834 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4835 /* Lisp primitives for working with characters */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4836 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4837

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4838 DEFUN ("make-char", Fmake_char, 2, 3, 0, /*

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4839 Make a character from CHARSET and octets ARG1 and ARG2.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4840 ARG2 is required only for characters from two-dimensional charsets.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4841

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4842 Each octet should be in the range 32 through 127 for a 96 or 96x96

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4843 charset and 33 through 126 for a 94 or 94x94 charset. (Most charsets

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4844 are either 96 or 94x94.) Note that this is 32 more than the values

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4845 typically given for 94x94 charsets. When two octets are required, the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4846 order is "standard" -- the same as appears in ISO-2022 encodings,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4847 reference tables, etc.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4848

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4849 \(Note the following non-obvious result: Computerized translation

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4850 tables often encode the two octets as the high and low bytes,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4851 respectively, of a hex short, while when there's only one octet, it

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4852 goes in the low byte. When decoding such a value, you need to treat

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4853 the two cases differently when calling make-char: One is (make-char

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4854 CHARSET HIGH LOW), the other is (make-char CHARSET LOW).)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4855

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4856 For example, (make-char 'latin-iso8859-2 185) or (make-char

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4857 'latin-iso8859-2 57) will return the Latin 2 character s with caron.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4858

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4859 As another example, the Japanese character for "kawa" (stream), which

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4860 looks something like this:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4861

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4862 | |

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4863 | | |

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4864 | | |

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4865 | | |

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4866 / |

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4867

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4868 appears in the Unicode Standard (version 2.0) on page 7-287 with the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4869 following values (see also page 7-4):

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4870

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4871 U 5DDD (Unicode)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4872 G 0-2008 (GB 2312-80)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4873 J 0-3278 (JIS X 0208-1990)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4874 K 0-8425 (KS C 5601-1987)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4875 B A474 (Big Five)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4876 C 1-4455 (CNS 11643-1986 (1st plane))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4877 A 213C34 (ANSI Z39.64-1989)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4878

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4879 These are equivalent to:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4880

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4881 \(make-char 'chinese-gb2312 52 40)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4882 \(make-char 'japanese-jisx0208 64 110)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4883 \(make-char 'korean-ksc5601 116 57)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4884 \(make-char 'chinese-cns11643-1 76 87)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4885 \(decode-big5-char '(164 . 116))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4886

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4887 \(All codes above are two decimal numbers except for Big Five and ANSI

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4888 Z39.64, which we don't support. We add 32 to each of the decimal

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4889 numbers. Big Five is split in a rather hackish fashion into two

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4890 charsets, `big5-1' and `big5-2', due to its excessive size -- 94x157,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4891 with the first codepoint in the range 0xA1 to 0xFE and the second in

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4892 the range 0x40 to 0x7E or 0xA1 to 0xFE. `decode-big5-char' is used to

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4893 generate the char from its codes, and `encode-big5-char' extracts the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4894 codes.)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4895

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4896 When compiled without MULE, this function does not do much, but it's

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4897 provided for compatibility. In this case, the following CHARSET symbols

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4898 are allowed:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4899

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4900 `ascii' -- ARG1 should be in the range 0 through 127.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4901 `control-1' -- ARG1 should be in the range 128 through 159.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4902 else -- ARG1 is coerced to be between 0 and 255, and then the high

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4903 bit is set.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4904

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4905 `int-to-char of the resulting ARG1' is returned, and ARG2 is always ignored.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4906 */

2333

ba4677f54a05 [xemacs-hg @ 2004-10-14 17:26:18 by james]

james

parents: 2286

diff changeset

4907 (charset, arg1, USED_IF_MULE (arg2)))

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4908 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4909 #ifdef MULE

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4910 Lisp_Charset *cs;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4911 int a1, a2;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4912 int lowlim, highlim;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4913

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4914 charset = Fget_charset (charset);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4915 cs = XCHARSET (charset);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4916

788

026c5bf9c134 [xemacs-hg @ 2002-03-21 07:29:57 by ben]

ben

parents: 771

diff changeset

4917 get_charset_limits (charset, &lowlim, &highlim);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4918

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4919 CHECK_INT (arg1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4920 /* It is useful (and safe, according to Olivier Galibert) to strip

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4921 the 8th bit off ARG1 and ARG2 because it allows programmers to

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4922 write (make-char 'latin-iso8859-2 CODE) where code is the actual

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4923 Latin 2 code of the character. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4924 a1 = XINT (arg1) & 0x7f;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4925 if (a1 < lowlim || a1 > highlim)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4926 args_out_of_range_3 (arg1, make_int (lowlim), make_int (highlim));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4927

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4928 if (CHARSET_DIMENSION (cs) == 1)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4929 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4930 if (!NILP (arg2))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4931 invalid_argument

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4932 ("Charset is of dimension one; second octet must be nil", arg2);

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4933 return make_char (make_ichar (charset, a1, 0));

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4934 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4935

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4936 CHECK_INT (arg2);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4937 a2 = XINT (arg2) & 0x7f;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4938 if (a2 < lowlim || a2 > highlim)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4939 args_out_of_range_3 (arg2, make_int (lowlim), make_int (highlim));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4940

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4941 return make_char (make_ichar (charset, a1, a2));

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4942 #else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4943 int a1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4944 int lowlim, highlim;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4945

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4946 if (EQ (charset, Qascii)) lowlim = 0, highlim = 127;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4947 else if (EQ (charset, Qcontrol_1)) lowlim = 0, highlim = 31;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4948 else lowlim = 0, highlim = 127;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4949

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4950 CHECK_INT (arg1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4951 /* It is useful (and safe, according to Olivier Galibert) to strip

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4952 the 8th bit off ARG1 and ARG2 because it allows programmers to

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4953 write (make-char 'latin-iso8859-2 CODE) where code is the actual

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4954 Latin 2 code of the character. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4955 a1 = XINT (arg1) & 0x7f;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4956 if (a1 < lowlim || a1 > highlim)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4957 args_out_of_range_3 (arg1, make_int (lowlim), make_int (highlim));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4958

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4959 if (EQ (charset, Qascii))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4960 return make_char (a1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4961 return make_char (a1 + 128);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4962 #endif /* MULE */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4963 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4964

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4965 #ifdef MULE

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4966

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4967 DEFUN ("char-charset", Fchar_charset, 1, 1, 0, /*

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4968 Return the character set of char CH.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4969 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4970 (ch))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4971 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4972 CHECK_CHAR_COERCE_INT (ch);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4973

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

4974 return XCHARSET_NAME (charset_by_leading_byte

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4975 (ichar_leading_byte (XCHAR (ch))));

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4976 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4977

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4978 DEFUN ("char-octet", Fchar_octet, 1, 2, 0, /*

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4979 Return the octet numbered N (should be 0 or 1) of char CH.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4980 N defaults to 0 if omitted.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4981 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4982 (ch, n))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4983 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4984 Lisp_Object charset;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4985 int octet0, octet1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4986

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4987 CHECK_CHAR_COERCE_INT (ch);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4988

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

4989 BREAKUP_ICHAR (XCHAR (ch), charset, octet0, octet1);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4990

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4991 if (NILP (n) || EQ (n, Qzero))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4992 return make_int (octet0);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4993 else if (EQ (n, make_int (1)))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4994 return make_int (octet1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4995 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4996 invalid_constant ("Octet number must be 0 or 1", n);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4997 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4998

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

4999 DEFUN ("split-char", Fsplit_char, 1, 1, 0, /*

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5000 Return list of charset and one or two position-codes of CHAR.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5001 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5002 (character))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5003 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5004 /* This function can GC */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5005 struct gcpro gcpro1, gcpro2;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5006 Lisp_Object charset = Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5007 Lisp_Object rc = Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5008 int c1, c2;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5009

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5010 GCPRO2 (charset, rc);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5011 CHECK_CHAR_COERCE_INT (character);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5012

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

5013 BREAKUP_ICHAR (XCHAR (character), charset, c1, c2);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5014

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5015 if (XCHARSET_DIMENSION (Fget_charset (charset)) == 2)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5016 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5017 rc = list3 (XCHARSET_NAME (charset), make_int (c1), make_int (c2));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5018 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5019 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5020 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5021 rc = list2 (XCHARSET_NAME (charset), make_int (c1));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5022 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5023 UNGCPRO;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5024

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5025 return rc;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5026 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5027

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5028 #endif /* MULE */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5029

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5030

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5031 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5032 /* composite character functions */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5033 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5034

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5035 #ifdef ENABLE_COMPOSITE_CHARS

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5036

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

5037 Ichar

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

5038 lookup_composite_char (Ibyte *str, int len)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5039 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5040 Lisp_Object lispstr = make_string (str, len);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5041 Lisp_Object ch = Fgethash (lispstr,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5042 Vcomposite_char_string2char_hash_table,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5043 Qunbound);

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

5044 Ichar emch;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5045

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5046 if (UNBOUNDP (ch))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5047 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5048 if (composite_char_row_next >= 128)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5049 invalid_operation ("No more composite chars available", lispstr);

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

5050 emch = make_ichar (Vcharset_composite, composite_char_row_next,

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5051 composite_char_col_next);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5052 Fputhash (make_char (emch), lispstr,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5053 Vcomposite_char_char2string_hash_table);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5054 Fputhash (lispstr, make_char (emch),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5055 Vcomposite_char_string2char_hash_table);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5056 composite_char_col_next++;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5057 if (composite_char_col_next >= 128)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5058 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5059 composite_char_col_next = 32;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5060 composite_char_row_next++;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5061 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5062 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5063 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5064 emch = XCHAR (ch);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5065 return emch;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5066 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5067

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5068 Lisp_Object

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

5069 composite_char_string (Ichar ch)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5070 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5071 Lisp_Object str = Fgethash (make_char (ch),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5072 Vcomposite_char_char2string_hash_table,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5073 Qunbound);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5074 assert (!UNBOUNDP (str));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5075 return str;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5076 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5077

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

5078 DEFUN ("make-composite-char", Fmake_composite_char, 1, 1, 0, /*

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5079 Convert a string into a single composite character.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5080 The character is the result of overstriking all the characters in

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5081 the string.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5082 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5083 (string))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5084 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5085 CHECK_STRING (string);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5086 return make_char (lookup_composite_char (XSTRING_DATA (string),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5087 XSTRING_LENGTH (string)));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5088 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5089

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

5090 DEFUN ("composite-char-string", Fcomposite_char_string, 1, 1, 0, /*

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5091 Return a string of the characters comprising a composite character.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5092 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5093 (ch))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5094 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

5095 Ichar emch;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5096

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5097 CHECK_CHAR (ch);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5098 emch = XCHAR (ch);

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

5099 if (ichar_leading_byte (emch) != LEADING_BYTE_COMPOSITE)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5100 invalid_argument ("Must be composite char", ch);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5101 return composite_char_string (emch);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5102 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5103 #endif /* ENABLE_COMPOSITE_CHARS */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5104

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5105

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5106 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5107 /* initialization */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5108 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5109

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5110 void

1204

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

5111 reinit_eistring_early (void)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5112 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5113 the_eistring_malloc_zero_init = the_eistring_zero_init;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5114 the_eistring_malloc_zero_init.mallocp_ = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5115 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5116

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5117 void

814

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 801

diff changeset

5118 init_eistring_once_early (void)

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 801

diff changeset

5119 {

1204

e22b0213b713 [xemacs-hg @ 2003-01-12 11:07:58 by michaels]

michaels

parents: 867

diff changeset

5120 reinit_eistring_early ();

814

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 801

diff changeset

5121 }

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 801

diff changeset

5122

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 801

diff changeset

5123 void

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5124 syms_of_text (void)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5125 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5126 DEFSUBR (Fmake_char);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5127

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5128 #ifdef MULE

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5129 DEFSUBR (Fchar_charset);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5130 DEFSUBR (Fchar_octet);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5131 DEFSUBR (Fsplit_char);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5132

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5133 #ifdef ENABLE_COMPOSITE_CHARS

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5134 DEFSUBR (Fmake_composite_char);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5135 DEFSUBR (Fcomposite_char_string);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5136 #endif

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5137 #endif /* MULE */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5138 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5139

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5140 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5141 reinit_vars_of_text (void)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5142 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5143 int i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5144

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

5145 conversion_in_dynarr_list = Dynarr_new2 (Ibyte_dynarr_dynarr,

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 853

diff changeset

5146 Ibyte_dynarr *);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5147 conversion_out_dynarr_list = Dynarr_new2 (Extbyte_dynarr_dynarr,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5148 Extbyte_dynarr *);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5149

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5150 for (i = 0; i <= MAX_BYTEBPOS_GAP_SIZE_3; i++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5151 three_to_one_table[i] = i / 3;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5152 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5153

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5154 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5155 vars_of_text (void)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5156 {

1292

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

5157 QSin_char_byte_conversion = build_msg_string ("(in char-byte conversion)");

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

5158 staticpro (&QSin_char_byte_conversion);

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

5159 QSin_internal_external_conversion =

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

5160 build_msg_string ("(in internal-external conversion)");

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

5161 staticpro (&QSin_internal_external_conversion);

f3437b56874d [xemacs-hg @ 2003-02-13 09:57:04 by ben]

ben

parents: 1204

diff changeset

5162

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5163 #ifdef ENABLE_COMPOSITE_CHARS

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5164 /* #### not dumped properly */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5165 composite_char_row_next = 32;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5166 composite_char_col_next = 32;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5167

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5168 Vcomposite_char_string2char_hash_table =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5169 make_lisp_hash_table (500, HASH_TABLE_NON_WEAK, HASH_TABLE_EQUAL);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5170 Vcomposite_char_char2string_hash_table =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5171 make_lisp_hash_table (500, HASH_TABLE_NON_WEAK, HASH_TABLE_EQ);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5172 staticpro (&Vcomposite_char_string2char_hash_table);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5173 staticpro (&Vcomposite_char_char2string_hash_table);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5174 #endif /* ENABLE_COMPOSITE_CHARS */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents:

diff changeset

5175 }

Mercurial > hg > xemacs-beta

annotate src/text.c @ 2500:3d8143fc88e1