xemacs-beta: src/file-coding.c annotate

author	youngs
date	Thu, 24 Oct 2002 14:59:27 +0000 (2002-10-24)
parents	7924b28c57a4
children	e22b0213b713

rev	line source
771 943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	1 /* Text encoding conversion functions; coding-system object.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	2 #### rename me to coding-system.c or coding.c
428 3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	3 Copyright (C) 1991, 1995 Free Software Foundation, Inc.
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	4 Copyright (C) 1995 Sun Microsystems, Inc.
771 943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	5 Copyright (C) 2000, 2001, 2002 Ben Wing.
428 3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	6
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	7 This file is part of XEmacs.
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	8
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	9 XEmacs is free software; you can redistribute it and/or modify it
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	10 under the terms of the GNU General Public License as published by the
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	11 Free Software Foundation; either version 2, or (at your option) any
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	12 later version.
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	13
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	14 XEmacs is distributed in the hope that it will be useful, but WITHOUT
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	15 ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	16 FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	17 for more details.
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	18
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	19 You should have received a copy of the GNU General Public License
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	20 along with XEmacs; see the file COPYING. If not, write to
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	21 the Free Software Foundation, Inc., 59 Temple Place - Suite 330,
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	22 Boston, MA 02111-1307, USA. */
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	23
771 943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	24 /* Synched up with: Not in FSF. */
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	25
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	26 /* Authorship:
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	27
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	28 Current primary author: Ben Wing <ben@xemacs.org>
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	29
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	30 Rewritten by Ben Wing <ben@xemacs.org>, based originally on coding.c
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	31 from Mule 2.? but probably does not share one line of code with that
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	32 original source. Rewriting work started around Dec. 1994. or Jan. 1995.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	33 Proceeded in earnest till Nov. 1995.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	34
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	35 Around Feb. 17, 1998, Andy Piper renamed what was then mule-coding.c to
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	36 file-coding.c, with the intention of using it to do end-of-line conversion
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	37 on non-MULE machines (specifically, on Windows machines). He separated
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	38 out the MULE stuff from non-MULE using ifdef's, and searched throughout
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	39 the rest of the source tree looking for coding-system-related code that
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	40 was ifdef MULE but should be ifdef HAVE_CODING_SYSTEMS.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	41
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	42 Sept. 4 - 8, 1998, Tomohiko Morioka added the UCS_4 and UTF_8 coding system
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	43 types, providing a primitive means of decoding and encoding externally-
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	44 formatted Unicode/UCS_4 and Unicode/UTF_8 data.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	45
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	46 January 25, 2000, Martin Buchholz redid and fleshed out the coding
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	47 system alias handling that was first added in prototype form by
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	48 Hrjove Niksic, April 15, 1999.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	49
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	50 April to May 2000, Ben Wing: More major reorganization. Adding features
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	51 needed for MS Windows (multibyte, unicode, unicode-to-multibyte), the
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	52 "chain" coding system for chaining two together, and doing a lot of
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	53 reorganization in preparation for properly abstracting out the different
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	54 coding system types.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	55
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	56 June 2001, Ben Wing: Added Unicode support. Eliminated previous
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	57 junky Unicode translation support.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	58
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	59 August 2001, Ben Wing: Moved Unicode support to unicode.c. Finished
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	60 abstracting everything except detection, which is hard to abstract (see
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	61 just below).
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	62
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	63 September 2001, Ben Wing: Moved Mule code to mule-coding.c, Windows code
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	64 to intl-win32.c. Lots more rewriting; very little code is untouched
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	65 from before April 2000. Abstracted the detection code, added multiple
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	66 levels of likelihood to increase the reliability of the algorithm.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	67
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	68 October 2001, Ben Wing: HAVE_CODING_SYSTEMS is always now defined.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	69 Removed the conditionals.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	70 */
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	71
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	72 /* Comments about future work
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	73
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	74 ------------------------------------------------------------------
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	75 ABOUT DETECTION
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	76 ------------------------------------------------------------------
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	77
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	78 however, in general the detection code has major problems and needs lots
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	79 of work:
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	80
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	81 -- instead of merely "yes" or "no" for particular categories, we need a
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	82 more flexible system, with various levels of likelihood. Currently
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	83 I've created a system with six levels, as follows:
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	84
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	85 [see file-coding.h]
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	86
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	87 Let's consider what this might mean for an ASCII text detector. (In
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	88 order to have accurate detection, especially given the iteration I
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	89 proposed below, we need active detectors for all types of data we
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	90 might reasonably encounter, such as ASCII text files, binary files,
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	91 and possibly other sorts of ASCII files, and not assume that simply
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	92 "falling back to no detection" will work at all well.)
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	93
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	94 An ASCII text detector DOES NOT report ASCII text as level 0, since
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	95 that's what the detector is looking for. Such a detector ideally
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	96 wants all bytes in the range 0x20 - 0x7E (no high bytes!), except for
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	97 whitespace control chars and perhaps a few others; LF, CR, or CRLF
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	98 sequences at regular intervals (where "regular" might mean an average
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	99 < 100 chars and 99% < 300 for code and other stuff of the "text file
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	100 w/line breaks" variety, but for the "text file w/o line breaks"
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	101 variety, excluding blank lines, averages could easily be 600 or more
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	102 with 2000-3000 char "lines" not so uncommon); similar statistical
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	103 variance between odds and evens (not Unicode); frequent occurrences of
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	104 the space character; letters more common than non-letters; etc. Also
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	105 checking for too little variability between frequencies of characters
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	106 and for exclusion of particular characters based on character ranges
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	107 can catch ASCII encodings like base-64, UUEncode, UTF-7, etc.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	108 Granted, this doesn't even apply to everything called "ASCII", and we
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	109 could potentially distinguish off ASCII for code, ASCII for text,
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	110 etc. as separate categories. However, it does give us a lot to work
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	111 off of, in deciding what likelihood to choose -- and it shows there's
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	112 in fact a lot of detectable patterns to look for even in something
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	113 seemingly so generic as ASCII. The detector would report most text
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	114 files in level 1 or level 2. EUC encodings, Shift-JIS, etc. probably
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	115 go to level -1 because they also pass the EOL test and all other tests
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	116 for the ASCII part of the text, but have lots of high bytes, which in
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	117 essence turn them into binary. Aberrant text files like something in
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	118 BASE64 encoding might get placed in level 0, because they pass most
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	119 tests but fail dramatically the frequency test; but they should not be
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	120 reported as any lower, because that would cause explicit prompting,
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	121 and the user should be able any valid text file without prompting.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	122 The escape sequences and the base-64-type checks might send 7-bit
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	123 iso2022 to 0, but probably not -1, for similar reasons.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	124
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	125 -- The assumed algorithm for the above detection levels is to in essence
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	126 sort categories first by detection level and then by priority.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	127 Perhaps, however, we would want smarter algorithms, or at least
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	128 something user-controllable -- in particular, when (other than no
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	129 category at level 0 or greater) do we prompt the user to pick a
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	130 category?
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	131
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	132 -- Improvements in how the detection algorithm works: we want to handle
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	133 lots of different ways something could be encoded, including multiple
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	134 stacked encodings. trying to specify a series of detection levels
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	135 (check for base64 first, then check for gzip, then check for an i18n
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	136 decoding, then for crlf) won't generally work. for example, what
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	137 about the same encoding appearing more than once? for example, take
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	138 euc-jp, base64'd, then gzip'd, then base64'd again: this could well
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	139 happen, and you could specify the encodings specifically as
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	140 base64\|gzip\|base64\|euc-jp, but we'd like to autodetect it without
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	141 worrying about exactly what order these things appear in. we should
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	142 allow for iterating over detection/decoding cycles until we reach
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	143 some maximum (we got stuck in a loop, due to incorrect category
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	144 tables or detection algorithms), have no reported detection levels
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	145 over -1, or we end up with no change after a decoding pass (i.e. the
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	146 coding system associated with a chosen category was `no-conversion'
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	147 or something equivalent). it might make sense to divide things into
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	148 two phases (internal and external), where the internal phase has a
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	149 separate category list and would probably mostly end up handling EOL
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	150 detection; but the i think about it, the more i disagree. with
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	151 properly written detectors, and properly organized tables (in
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	152 general, those decodings that are more "distinctive" and thus
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	153 detectable with greater certainty go lower on the list), we shouldn't
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	154 need two phases. for example, let's say the example above was also
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	155 in CRLF format. The EOL detector (which really detects plain text
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	156 with a particular EOL type) would return at most level 0 for all
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	157 results until the text file is reached, whereas the base64, gzip or
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	158 euc-jp decoders will return higher. Once the text file is reached,
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	159 the EOL detector will return 0 or higher for the CRLF encoding, and
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	160 all other decoders will return 0 or lower; thus, we will successfully
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	161 proceed through CRLF decoding, or at worst prompt the user. (The only
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	162 external-vs-internal distinction that might make sense here is to
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	163 favor coding systems of the correct source type over those that
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	164 require conversion between external and internal; if done right, this
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	165 could allow the CRLF detector to return level 1 for all CRLF-encoded
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	166 text files, even those that look like Base-64 or similar encoding, so
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	167 that CRLF encoding will always get decoded without prompting, but not
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	168 interfere with other decoders. On the other hand, this
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	169 external-vs-internal distinction may not matter at all -- with
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	170 automatic internal-external conversion, CRLF decoding can occur
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	171 before or after decoding of euc-jp, base64, iso2022, or similar,
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	172 without any difference in the final results.)
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	173
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	174 -- There need to be two priority lists and two
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	175 category->coding-system lists. Once is general, the other
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	176 category->langenv-specific. The user sets the former, the langenv
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	177 category->the latter. The langenv-specific entries take precedence
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	178 category->over the others. This works similarly to the
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	179 category->category->Unicode charset priority list.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	180
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	181 -- The simple list of coding categories per detectors is not enough.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	182 Instead of coding categories, we need parameters. For example,
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	183 Unicode might have separate detectors for UTF-8, UTF-7, UTF-16,
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	184 and perhaps UCS-4; or UTF-16/UCS-4 would be one detection type.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	185 UTF-16 would have parameters such as "little-endian" and "needs BOM",
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	186 and possibly another one like "collapse/expand/leave alone composite
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	187 sequences" once we add this support. Usually these parameters
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	188 correspond directly to a coding system parameter. Different
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	189 likelihood values can be specified for each parameter as well as for
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	190 the detection type as a whole. The user can specify particular
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	191 coding systems for a particular combination of detection type and
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	192 parameters, or can give "default parameters" associated with a
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	193 detection type. In the latter case, we create a new coding system as
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	194 necessary that corresponds to the detected type and parameters.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	195
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	196 -- a better means of presentation. rather than just coming up
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	197 with the new file decoded according to the detected coding
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	198 system, allow the user to browse through the file and
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	199 conveniently reject it if it looks wrong; then detection
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	200 starts again, but with that possibility removed. in cases where
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	201 certainty is low and thus more than one possibility is presented,
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	202 the user can browse each one and select one or reject them all.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	203
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	204 -- fail-safe: even after the user has made a choice, if they
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	205 later on realize they have the wrong coding system, they can
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	206 go back, and we've squirreled away the original data so they
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	207 can start the process over. this may be tricky.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	208
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	209 -- using a larger buffer for detection. we use just a small
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	210 piece, which can give quite random results. we may need to
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	211 buffer up all the data we look through because we can't
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	212 necessarily rewind. the idea is we proceed until we get a
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	213 result that's at least at a certain level of certainty
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	214 (e.g. "probable") or we reached a maximum limit of how much
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	215 we want to buffer.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	216
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	217 -- dealing with interactive systems. we might need to go ahead
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	218 and present the data before we've finished detection, and
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	219 then re-decode it, perhaps multiple times, as we get better
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	220 detection results.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	221
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	222 -- Clearly some of these are more important than others. at the
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	223 very least, the "better means of presentation" should be
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	224 implementation as soon as possibl, along with a very simple means
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	225 of fail-safe whenever the data is readibly available, e.g. it's
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	226 coming from a file, which is the most common scenario.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	227
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	228
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	229 ------------------------------------------------------------------
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	230 ABOUT FORMATS
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	231 ------------------------------------------------------------------
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	232
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	233 when calling make-coding-system, the name can be a cons of (format1 .
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	234 format2), specifying that it decodes format1->format2 and encodes the other
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	235 way. if only one name is given, that is assumed to be format1, and the
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	236 other is either `external' or `internal' depending on the end type.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	237 normally the user when decoding gives the decoding order in formats, but
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	238 can leave off the last one, `internal', which is assumed. a multichain
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	239 might look like gzip\|multibyte\|unicode, using the coding systems named
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	240 `gzip', `(unicode . multibyte)' and `unicode'. the way this actually works
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	241 is by searching for gzip->multibyte; if not found, look for gzip->external
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	242 or gzip->internal. (In general we automatically do conversion between
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	243 internal and external as necessary: thus gzip\|crlf does the expected, and
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	244 maps to gzip->external, external->internal, crlf->internal, which when
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	245 fully specified would be gzip\|external:external\|internal:crlf\|internal --
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	246 see below.) To forcibly fit together two converters that have explicitly
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	247 specified and incompatible names (say you have unicode->multibyte and
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	248 iso8859-1->ebcdic and you know that the multibyte and iso8859-1 in this
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	249 case are compatible), you can force-cast using :, like this:
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	250 ebcdic\|iso8859-1:multibyte\|unicode. (again, if you force-cast between
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	251 internal and external formats, the conversion happens automatically.)
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	252
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	253 --------------------------------------------------------------------------
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	254 ABOUT PDUMP, UNICODE, AND RUNNING XEMACS FROM A DIRECTORY WITH WEIRD CHARS
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	255 --------------------------------------------------------------------------
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	256
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	257 -- there's the problem that XEmacs can't be run in a directory with
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	258 non-ASCII/Latin-1 chars in it, since it will be doing Unicode
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	259 processing before we've had a chance to load the tables. In fact,
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	260 even finding the tables in such a situation is problematic using
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	261 the normal commands. my idea is to eventually load the stuff
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	262 extremely extremely early, at the same time as the pdump data gets
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	263 loaded. in fact, the unicode table data (stored in an efficient
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	264 binary format) can even be stuck into the pdump file (which would
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	265 mean as a resource to the executable, for windows). we'd need to
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	266 extend pdump a bit: to allow for attaching extra data to the pdump
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	267 file. (something like pdump_attach_extra_data (addr, length)
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	268 returns a number of some sort, an index into the file, which you
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	269 can then retrieve with pdump_load_extra_data(), which returns an
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	270 addr (mmap()ed or loaded), and later you pdump_unload_extra_data()
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	271 when finished. we'd probably also need
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	272 pdump_attach_extra_data_append(), which appends data to the data
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	273 just written out with pdump_attach_extra_data(). this way,
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	274 multiple tables in memory can be written out into one contiguous
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	275 table. (we'd use the tar-like trick of allowing new blocks to be
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	276 written without going back to change the old blocks -- we just rely
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	277 on the end of file/end of memory.) this same mechanism could be
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	278 extracted out of pdump and used to handle the non-pdump situation
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	279 (or alternatively, we could just dump either the memory image of
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	280 the tables themselves or the compressed binary version). in the
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	281 case of extra unicode tables not known about at compile time that
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	282 get loaded before dumping, we either just dump them into the image
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	283 (pdump and all) or extract them into the compressed binary format,
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	284 free the original tables, and treat them like all other tables.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	285
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	286 --------------------------------------------------------------------------
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	287 HANDLING WRITING A FILE SAFELY, WITHOUT DATA LOSS
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	288 --------------------------------------------------------------------------
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	289
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	290 -- When writing a file, we need error detection; otherwise somebody
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	291 will create a Unicode file without realizing the coding system
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	292 of the buffer is Raw, and then lose all the non-ASCII/Latin-1
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	293 text when it's written out. We need two levels
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	294
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	295 1. first, a "safe-charset" level that checks before any actual
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	296 encoding to see if all characters in the document can safely
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	297 be represented using the given coding system. FSF has a
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	298 "safe-charset" property of coding systems, but it's stupid
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	299 because this information can be automatically derived from
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	300 the coding system, at least the vast majority of the time.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	301 What we need is some sort of
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	302 alternative-coding-system-precedence-list, langenv-specific,
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	303 where everything on it can be checked for safe charsets and
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	304 then the user given a list of possibilities. When the user
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	305 does "save with specified encoding", they should see the same
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	306 precedence list. Again like with other precedence lists,
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	307 there's also a global one, and presumably all coding systems
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	308 not on other list get appended to the end (and perhaps not
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	309 checked at all when doing safe-checking?). safe-checking
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	310 should work something like this: compile a list of all
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	311 charsets used in the buffer, along with a count of chars
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	312 used. that way, "slightly unsafe" charsets can perhaps be
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	313 presented at the end, which will lose only a few characters
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	314 and are perhaps what the users were looking for.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	315
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	316 2. when actually writing out, we need error checking in case an
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	317 individual char in a charset can't be written even though the
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	318 charsets are safe. again, the user gets the choice of other
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	319 reasonable coding systems.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	320
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	321 3. same thing (error checking, list of alternatives, etc.) needs
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	322 to happen when reading! all of this will be a lot of work!
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	323
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	324
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	325 --ben
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	326 */
428 3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	327
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	328 #include <config.h>
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	329 #include "lisp.h"
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	330
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	331 #include "buffer.h"
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	332 #include "elhash.h"
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	333 #include "insdel.h"
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	334 #include "lstream.h"
440 8de8e3f6228a Import from CVS: tag r21-2-28 cvs parents: 438 diff changeset	335 #include "opaque.h"
771 943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	336 #include "file-coding.h"
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	337
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	338 #ifdef HAVE_ZLIB
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	339 #include "zlib.h"
428 3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	340 #endif
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	341
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	342 Lisp_Object Vkeyboard_coding_system;
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	343 Lisp_Object Vterminal_coding_system;
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	344 Lisp_Object Vcoding_system_for_read;
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	345 Lisp_Object Vcoding_system_for_write;
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	346 Lisp_Object Vfile_name_coding_system;
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	347
771 943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	348 #ifdef DEBUG_XEMACS
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	349 Lisp_Object Vdebug_coding_detection;
440 8de8e3f6228a Import from CVS: tag r21-2-28 cvs parents: 438 diff changeset	350 #endif
771 943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	351
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	352 typedef struct coding_system_type_entry
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	353 {
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	354 struct coding_system_methods *meths;
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	355 } coding_system_type_entry;
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	356
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	357 typedef struct
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	358 {
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	359 Dynarr_declare (coding_system_type_entry);
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	360 } coding_system_type_entry_dynarr;
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	361
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	362 static coding_system_type_entry_dynarr *the_coding_system_type_entry_dynarr;
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	363
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	364 static const struct lrecord_description cste_description_1[] = {
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	365 { XD_STRUCT_PTR, offsetof (coding_system_type_entry, meths), 1, &coding_system_methods_description },
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	366 { XD_END }
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	367 };
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	368
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	369 static const struct struct_description cste_description = {
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	370 sizeof (coding_system_type_entry),
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	371 cste_description_1
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	372 };
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	373
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	374 static const struct lrecord_description csted_description_1[] = {
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	375 XD_DYNARR_DESC (coding_system_type_entry_dynarr, &cste_description),
428 3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	376 { XD_END }
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	377 };
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	378
771 943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	379 static const struct struct_description csted_description = {
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	380 sizeof (coding_system_type_entry_dynarr),
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	381 csted_description_1
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	382 };
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	383
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	384 static Lisp_Object Vcoding_system_type_list;
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	385
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	386 /* Coding system currently associated with each coding category. */
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	387 Lisp_Object coding_category_system[MAX_DETECTOR_CATEGORIES];
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	388
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	389 /* Table of all coding categories in decreasing order of priority.
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	390 This describes a permutation of the possible coding categories. */
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	391 int coding_category_by_priority[MAX_DETECTOR_CATEGORIES];
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	392
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	393 /* Value used with to give a unique name to nameless coding systems */
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	394 int coding_system_tick;
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	395
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	396 int coding_detector_count;
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	397 int coding_detector_category_count;
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	398
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	399 detector_dynarr *all_coding_detectors;
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	400
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	401 static const struct lrecord_description struct_detector_category_description_1[]
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	402 =
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	403 {
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	404 { XD_LISP_OBJECT, offsetof (struct detector_category, sym) },
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	405 { XD_END }
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	406 };
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	407
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	408 static const struct struct_description struct_detector_category_description =
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	409 {
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	410 sizeof (struct detector_category),
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	411 struct_detector_category_description_1
428 3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	412 };
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	413
771 943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	414 static const struct lrecord_description detector_category_dynarr_description_1[] =
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	415 {
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	416 XD_DYNARR_DESC (detector_category_dynarr,
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	417 &struct_detector_category_description),
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	418 { XD_END }
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	419 };
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	420
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	421 static const struct struct_description detector_category_dynarr_description = {
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	422 sizeof (detector_category_dynarr),
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	423 detector_category_dynarr_description_1
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	424 };
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	425
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	426 static const struct lrecord_description struct_detector_description_1[]
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	427 =
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	428 {
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	429 { XD_STRUCT_PTR, offsetof (struct detector, cats), 1,
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	430 &detector_category_dynarr_description },
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	431 { XD_END }
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	432 };
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	433
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	434 static const struct struct_description struct_detector_description =
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	435 {
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	436 sizeof (struct detector),
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	437 struct_detector_description_1
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	438 };
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	439
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	440 static const struct lrecord_description detector_dynarr_description_1[] =
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	441 {
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	442 XD_DYNARR_DESC (detector_dynarr, &struct_detector_description),
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	443 { XD_END }
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	444 };
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	445
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	446 static const struct struct_description detector_dynarr_description = {
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	447 sizeof (detector_dynarr),
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	448 detector_dynarr_description_1
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	449 };
428 3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	450
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	451 Lisp_Object Qcoding_systemp;
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	452
771 943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	453 Lisp_Object Qraw_text;
428 3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	454
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	455 Lisp_Object Qmnemonic, Qeol_type;
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	456 Lisp_Object Qcr, Qcrlf, Qlf;
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	457 Lisp_Object Qeol_cr, Qeol_crlf, Qeol_lf;
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	458 Lisp_Object Qpost_read_conversion;
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	459 Lisp_Object Qpre_write_conversion;
3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	460
771 943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	461 Lisp_Object Qtranslation_table_for_decode;
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	462 Lisp_Object Qtranslation_table_for_encode;
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	463 Lisp_Object Qsafe_chars;
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	464 Lisp_Object Qsafe_charsets;
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	465 Lisp_Object Qmime_charset;
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	466 Lisp_Object Qvalid_codes;
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	467
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	468 Lisp_Object Qno_conversion;
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	469 Lisp_Object Qconvert_eol;
440 8de8e3f6228a Import from CVS: tag r21-2-28 cvs parents: 438 diff changeset	470 Lisp_Object Qescape_quoted;
771 943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	471 Lisp_Object Qencode, Qdecode;
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	472
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	473 Lisp_Object Qconvert_eol_lf, Qconvert_eol_cr, Qconvert_eol_crlf;
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	474 Lisp_Object Qconvert_eol_autodetect;
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	475
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	476 Lisp_Object Qnear_certainty, Qquite_probable, Qsomewhat_likely;
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	477 Lisp_Object Qas_likely_as_unlikely, Qsomewhat_unlikely, Qquite_improbable;
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	478 Lisp_Object Qnearly_impossible;
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	479
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	480 Lisp_Object Qdo_eol, Qdo_coding;
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	481
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	482 Lisp_Object Qcanonicalize_after_coding;
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	483
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	484 /* This is used to convert autodetected coding systems into existing
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	485 systems. For example, the chain undecided->convert-eol-autodetect may
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	486 have its separate parts detected as mswindows-multibyte and
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	487 convert-eol-crlf, and the result needs to be mapped to
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	488 mswindows-multibyte-dos. */
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	489 /* #### It's not clear we need this whole chain-canonicalize mechanism
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	490 any more. */
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	491 static Lisp_Object Vchain_canonicalize_hash_table;
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	492
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	493 #ifdef HAVE_ZLIB
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	494 Lisp_Object Qgzip;
428 3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	495 #endif
771 943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	496
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	497 /* Maps coding system names to either coding system objects or (for
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	498 aliases) other names. */
943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben] ben parents: 665 diff changeset	499 static Lisp_Object Vcoding_system_hash_table;
428 3ecd8885ac67 Import from CVS: tag r21-2-22 cvs parents: diff changeset	500

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1 /* Text encoding conversion functions; coding-system object.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2 #### rename me to coding-system.c or coding.c

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

6

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

7 This file is part of XEmacs.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

8

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

9 XEmacs is free software; you can redistribute it and/or modify it

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

10 under the terms of the GNU General Public License as published by the

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

11 Free Software Foundation; either version 2, or (at your option) any

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

12 later version.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

13

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

14 XEmacs is distributed in the hope that it will be useful, but WITHOUT

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

15 ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

16 FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

17 for more details.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

18

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

19 You should have received a copy of the GNU General Public License

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

20 along with XEmacs; see the file COPYING. If not, write to

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

21 the Free Software Foundation, Inc., 59 Temple Place - Suite 330,

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

22 Boston, MA 02111-1307, USA. */

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

23

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

24 /* Synched up with: Not in FSF. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

25

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

26 /* Authorship:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

27

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

28 Current primary author: Ben Wing <ben@xemacs.org>

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

29

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

30 Rewritten by Ben Wing <ben@xemacs.org>, based originally on coding.c

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

31 from Mule 2.? but probably does not share one line of code with that

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

32 original source. Rewriting work started around Dec. 1994. or Jan. 1995.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

33 Proceeded in earnest till Nov. 1995.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

34

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

35 Around Feb. 17, 1998, Andy Piper renamed what was then mule-coding.c to

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

36 file-coding.c, with the intention of using it to do end-of-line conversion

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

37 on non-MULE machines (specifically, on Windows machines). He separated

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

38 out the MULE stuff from non-MULE using ifdef's, and searched throughout

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

39 the rest of the source tree looking for coding-system-related code that

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

40 was ifdef MULE but should be ifdef HAVE_CODING_SYSTEMS.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

41

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

42 Sept. 4 - 8, 1998, Tomohiko Morioka added the UCS_4 and UTF_8 coding system

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

43 types, providing a primitive means of decoding and encoding externally-

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

44 formatted Unicode/UCS_4 and Unicode/UTF_8 data.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

45

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

46 January 25, 2000, Martin Buchholz redid and fleshed out the coding

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

47 system alias handling that was first added in prototype form by

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

48 Hrjove Niksic, April 15, 1999.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

49

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

50 April to May 2000, Ben Wing: More major reorganization. Adding features

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

51 needed for MS Windows (multibyte, unicode, unicode-to-multibyte), the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

52 "chain" coding system for chaining two together, and doing a lot of

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

53 reorganization in preparation for properly abstracting out the different

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

54 coding system types.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

55

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

56 June 2001, Ben Wing: Added Unicode support. Eliminated previous

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

57 junky Unicode translation support.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

58

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

59 August 2001, Ben Wing: Moved Unicode support to unicode.c. Finished

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

60 abstracting everything except detection, which is hard to abstract (see

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

61 just below).

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

62

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

63 September 2001, Ben Wing: Moved Mule code to mule-coding.c, Windows code

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

64 to intl-win32.c. Lots more rewriting; very little code is untouched

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

65 from before April 2000. Abstracted the detection code, added multiple

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

66 levels of likelihood to increase the reliability of the algorithm.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

67

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

68 October 2001, Ben Wing: HAVE_CODING_SYSTEMS is always now defined.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

69 Removed the conditionals.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

70 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

71

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

72 /* Comments about future work

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

73

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

74 ------------------------------------------------------------------

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

75 ABOUT DETECTION

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

76 ------------------------------------------------------------------

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

77

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

78 however, in general the detection code has major problems and needs lots

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

79 of work:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

80

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

81 -- instead of merely "yes" or "no" for particular categories, we need a

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

82 more flexible system, with various levels of likelihood. Currently

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

83 I've created a system with six levels, as follows:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

84

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

85 [see file-coding.h]

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

86

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

87 Let's consider what this might mean for an ASCII text detector. (In

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

88 order to have accurate detection, especially given the iteration I

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

89 proposed below, we need active detectors for *all* types of data we

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

90 might reasonably encounter, such as ASCII text files, binary files,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

91 and possibly other sorts of ASCII files, and not assume that simply

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

92 "falling back to no detection" will work at all well.)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

93

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

94 An ASCII text detector DOES NOT report ASCII text as level 0, since

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

95 that's what the detector is looking for. Such a detector ideally

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

96 wants all bytes in the range 0x20 - 0x7E (no high bytes!), except for

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

97 whitespace control chars and perhaps a few others; LF, CR, or CRLF

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

98 sequences at regular intervals (where "regular" might mean an average

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

99 < 100 chars and 99% < 300 for code and other stuff of the "text file

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

100 w/line breaks" variety, but for the "text file w/o line breaks"

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

101 variety, excluding blank lines, averages could easily be 600 or more

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

102 with 2000-3000 char "lines" not so uncommon); similar statistical

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

103 variance between odds and evens (not Unicode); frequent occurrences of

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

104 the space character; letters more common than non-letters; etc. Also

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

105 checking for too little variability between frequencies of characters

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

106 and for exclusion of particular characters based on character ranges

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

107 can catch ASCII encodings like base-64, UUEncode, UTF-7, etc.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

108 Granted, this doesn't even apply to everything called "ASCII", and we

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

109 could potentially distinguish off ASCII for code, ASCII for text,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

110 etc. as separate categories. However, it does give us a lot to work

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

111 off of, in deciding what likelihood to choose -- and it shows there's

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

112 in fact a lot of detectable patterns to look for even in something

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

113 seemingly so generic as ASCII. The detector would report most text

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

114 files in level 1 or level 2. EUC encodings, Shift-JIS, etc. probably

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

115 go to level -1 because they also pass the EOL test and all other tests

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

116 for the ASCII part of the text, but have lots of high bytes, which in

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

117 essence turn them into binary. Aberrant text files like something in

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

118 BASE64 encoding might get placed in level 0, because they pass most

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

119 tests but fail dramatically the frequency test; but they should not be

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

120 reported as any lower, because that would cause explicit prompting,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

121 and the user should be able any valid text file without prompting.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

122 The escape sequences and the base-64-type checks might send 7-bit

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

123 iso2022 to 0, but probably not -1, for similar reasons.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

124

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

125 -- The assumed algorithm for the above detection levels is to in essence

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

126 sort categories first by detection level and then by priority.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

127 Perhaps, however, we would want smarter algorithms, or at least

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

128 something user-controllable -- in particular, when (other than no

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

129 category at level 0 or greater) do we prompt the user to pick a

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

130 category?

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

131

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

132 -- Improvements in how the detection algorithm works: we want to handle

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

133 lots of different ways something could be encoded, including multiple

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

134 stacked encodings. trying to specify a series of detection levels

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

135 (check for base64 first, then check for gzip, then check for an i18n

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

136 decoding, then for crlf) won't generally work. for example, what

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

137 about the same encoding appearing more than once? for example, take

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

138 euc-jp, base64'd, then gzip'd, then base64'd again: this could well

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

139 happen, and you could specify the encodings specifically as

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

140 base64|gzip|base64|euc-jp, but we'd like to autodetect it without

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

141 worrying about exactly what order these things appear in. we should

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

142 allow for iterating over detection/decoding cycles until we reach

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

143 some maximum (we got stuck in a loop, due to incorrect category

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

144 tables or detection algorithms), have no reported detection levels

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

145 over -1, or we end up with no change after a decoding pass (i.e. the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

146 coding system associated with a chosen category was `no-conversion'

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

147 or something equivalent). it might make sense to divide things into

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

148 two phases (internal and external), where the internal phase has a

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

149 separate category list and would probably mostly end up handling EOL

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

150 detection; but the i think about it, the more i disagree. with

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

151 properly written detectors, and properly organized tables (in

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

152 general, those decodings that are more "distinctive" and thus

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

153 detectable with greater certainty go lower on the list), we shouldn't

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

154 need two phases. for example, let's say the example above was also

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

155 in CRLF format. The EOL detector (which really detects *plain text*

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

156 with a particular EOL type) would return at most level 0 for all

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

157 results until the text file is reached, whereas the base64, gzip or

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

158 euc-jp decoders will return higher. Once the text file is reached,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

159 the EOL detector will return 0 or higher for the CRLF encoding, and

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

160 all other decoders will return 0 or lower; thus, we will successfully

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

161 proceed through CRLF decoding, or at worst prompt the user. (The only

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

162 external-vs-internal distinction that might make sense here is to

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

163 favor coding systems of the correct source type over those that

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

164 require conversion between external and internal; if done right, this

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

165 could allow the CRLF detector to return level 1 for all CRLF-encoded

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

166 text files, even those that look like Base-64 or similar encoding, so

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

167 that CRLF encoding will always get decoded without prompting, but not

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

168 interfere with other decoders. On the other hand, this

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

169 external-vs-internal distinction may not matter at all -- with

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

170 automatic internal-external conversion, CRLF decoding can occur

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

171 before or after decoding of euc-jp, base64, iso2022, or similar,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

172 without any difference in the final results.)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

173

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

174 -- There need to be two priority lists and two

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

175 category->coding-system lists. Once is general, the other

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

176 category->langenv-specific. The user sets the former, the langenv

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

177 category->the latter. The langenv-specific entries take precedence

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

178 category->over the others. This works similarly to the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

179 category->category->Unicode charset priority list.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

180

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

181 -- The simple list of coding categories per detectors is not enough.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

182 Instead of coding categories, we need parameters. For example,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

183 Unicode might have separate detectors for UTF-8, UTF-7, UTF-16,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

184 and perhaps UCS-4; or UTF-16/UCS-4 would be one detection type.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

185 UTF-16 would have parameters such as "little-endian" and "needs BOM",

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

186 and possibly another one like "collapse/expand/leave alone composite

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

187 sequences" once we add this support. Usually these parameters

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

188 correspond directly to a coding system parameter. Different

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

189 likelihood values can be specified for each parameter as well as for

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

190 the detection type as a whole. The user can specify particular

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

191 coding systems for a particular combination of detection type and

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

192 parameters, or can give "default parameters" associated with a

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

193 detection type. In the latter case, we create a new coding system as

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

194 necessary that corresponds to the detected type and parameters.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

195

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

196 -- a better means of presentation. rather than just coming up

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

197 with the new file decoded according to the detected coding

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

198 system, allow the user to browse through the file and

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

199 conveniently reject it if it looks wrong; then detection

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

200 starts again, but with that possibility removed. in cases where

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

201 certainty is low and thus more than one possibility is presented,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

202 the user can browse each one and select one or reject them all.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

203

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

204 -- fail-safe: even after the user has made a choice, if they

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

205 later on realize they have the wrong coding system, they can

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

206 go back, and we've squirreled away the original data so they

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

207 can start the process over. this may be tricky.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

208

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

209 -- using a larger buffer for detection. we use just a small

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

210 piece, which can give quite random results. we may need to

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

211 buffer up all the data we look through because we can't

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

212 necessarily rewind. the idea is we proceed until we get a

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

213 result that's at least at a certain level of certainty

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

214 (e.g. "probable") or we reached a maximum limit of how much

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

215 we want to buffer.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

216

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

217 -- dealing with interactive systems. we might need to go ahead

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

218 and present the data before we've finished detection, and

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

219 then re-decode it, perhaps multiple times, as we get better

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

220 detection results.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

221

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

222 -- Clearly some of these are more important than others. at the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

223 very least, the "better means of presentation" should be

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

224 implementation as soon as possibl, along with a very simple means

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

225 of fail-safe whenever the data is readibly available, e.g. it's

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

226 coming from a file, which is the most common scenario.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

227

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

228

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

229 ------------------------------------------------------------------

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

230 ABOUT FORMATS

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

231 ------------------------------------------------------------------

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

232

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

233 when calling make-coding-system, the name can be a cons of (format1 .

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

234 format2), specifying that it decodes format1->format2 and encodes the other

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

235 way. if only one name is given, that is assumed to be format1, and the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

236 other is either `external' or `internal' depending on the end type.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

237 normally the user when decoding gives the decoding order in formats, but

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

238 can leave off the last one, `internal', which is assumed. a multichain

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

239 might look like gzip|multibyte|unicode, using the coding systems named

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

240 `gzip', `(unicode . multibyte)' and `unicode'. the way this actually works

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

241 is by searching for gzip->multibyte; if not found, look for gzip->external

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

242 or gzip->internal. (In general we automatically do conversion between

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

243 internal and external as necessary: thus gzip|crlf does the expected, and

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

244 maps to gzip->external, external->internal, crlf->internal, which when

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

245 fully specified would be gzip|external:external|internal:crlf|internal --

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

246 see below.) To forcibly fit together two converters that have explicitly

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

247 specified and incompatible names (say you have unicode->multibyte and

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

248 iso8859-1->ebcdic and you know that the multibyte and iso8859-1 in this

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

249 case are compatible), you can force-cast using :, like this:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

250 ebcdic|iso8859-1:multibyte|unicode. (again, if you force-cast between

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

251 internal and external formats, the conversion happens automatically.)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

252

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

253 --------------------------------------------------------------------------

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

254 ABOUT PDUMP, UNICODE, AND RUNNING XEMACS FROM A DIRECTORY WITH WEIRD CHARS

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

255 --------------------------------------------------------------------------

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

256

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

257 -- there's the problem that XEmacs can't be run in a directory with

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

258 non-ASCII/Latin-1 chars in it, since it will be doing Unicode

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

259 processing before we've had a chance to load the tables. In fact,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

260 even finding the tables in such a situation is problematic using

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

261 the normal commands. my idea is to eventually load the stuff

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

262 extremely extremely early, at the same time as the pdump data gets

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

263 loaded. in fact, the unicode table data (stored in an efficient

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

264 binary format) can even be stuck into the pdump file (which would

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

265 mean as a resource to the executable, for windows). we'd need to

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

266 extend pdump a bit: to allow for attaching extra data to the pdump

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

267 file. (something like pdump_attach_extra_data (addr, length)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

268 returns a number of some sort, an index into the file, which you

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

269 can then retrieve with pdump_load_extra_data(), which returns an

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

270 addr (mmap()ed or loaded), and later you pdump_unload_extra_data()

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

271 when finished. we'd probably also need

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

272 pdump_attach_extra_data_append(), which appends data to the data

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

273 just written out with pdump_attach_extra_data(). this way,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

274 multiple tables in memory can be written out into one contiguous

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

275 table. (we'd use the tar-like trick of allowing new blocks to be

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

276 written without going back to change the old blocks -- we just rely

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

277 on the end of file/end of memory.) this same mechanism could be

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

278 extracted out of pdump and used to handle the non-pdump situation

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

279 (or alternatively, we could just dump either the memory image of

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

280 the tables themselves or the compressed binary version). in the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

281 case of extra unicode tables not known about at compile time that

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

282 get loaded before dumping, we either just dump them into the image

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

283 (pdump and all) or extract them into the compressed binary format,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

284 free the original tables, and treat them like all other tables.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

285

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

286 --------------------------------------------------------------------------

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

287 HANDLING WRITING A FILE SAFELY, WITHOUT DATA LOSS

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

288 --------------------------------------------------------------------------

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

289

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

290 -- When writing a file, we need error detection; otherwise somebody

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

291 will create a Unicode file without realizing the coding system

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

292 of the buffer is Raw, and then lose all the non-ASCII/Latin-1

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

293 text when it's written out. We need two levels

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

294

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

295 1. first, a "safe-charset" level that checks before any actual

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

296 encoding to see if all characters in the document can safely

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

297 be represented using the given coding system. FSF has a

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

298 "safe-charset" property of coding systems, but it's stupid

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

299 because this information can be automatically derived from

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

300 the coding system, at least the vast majority of the time.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

301 What we need is some sort of

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

302 alternative-coding-system-precedence-list, langenv-specific,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

303 where everything on it can be checked for safe charsets and

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

304 then the user given a list of possibilities. When the user

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

305 does "save with specified encoding", they should see the same

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

306 precedence list. Again like with other precedence lists,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

307 there's also a global one, and presumably all coding systems

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

308 not on other list get appended to the end (and perhaps not

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

309 checked at all when doing safe-checking?). safe-checking

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

310 should work something like this: compile a list of all

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

311 charsets used in the buffer, along with a count of chars

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

312 used. that way, "slightly unsafe" charsets can perhaps be

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

313 presented at the end, which will lose only a few characters

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

314 and are perhaps what the users were looking for.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

315

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

316 2. when actually writing out, we need error checking in case an

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

317 individual char in a charset can't be written even though the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

318 charsets are safe. again, the user gets the choice of other

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

319 reasonable coding systems.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

320

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

321 3. same thing (error checking, list of alternatives, etc.) needs

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

322 to happen when reading! all of this will be a lot of work!

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

323

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

324

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

325 --ben

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

326 */

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

327

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

328 #include <config.h>

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

329 #include "lisp.h"

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

330

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

331 #include "buffer.h"

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

332 #include "elhash.h"

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

333 #include "insdel.h"

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

334 #include "lstream.h"

440

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

335 #include "opaque.h"

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

336 #include "file-coding.h"

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

337

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

338 #ifdef HAVE_ZLIB

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

339 #include "zlib.h"

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

340 #endif

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

341

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

342 Lisp_Object Vkeyboard_coding_system;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

343 Lisp_Object Vterminal_coding_system;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

344 Lisp_Object Vcoding_system_for_read;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

345 Lisp_Object Vcoding_system_for_write;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

346 Lisp_Object Vfile_name_coding_system;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

347

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

348 #ifdef DEBUG_XEMACS

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

349 Lisp_Object Vdebug_coding_detection;

440

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

350 #endif

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

351

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

352 typedef struct coding_system_type_entry

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

353 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

354 struct coding_system_methods *meths;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

355 } coding_system_type_entry;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

356

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

357 typedef struct

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

358 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

359 Dynarr_declare (coding_system_type_entry);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

360 } coding_system_type_entry_dynarr;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

361

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

362 static coding_system_type_entry_dynarr *the_coding_system_type_entry_dynarr;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

363

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

364 static const struct lrecord_description cste_description_1[] = {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

365 { XD_STRUCT_PTR, offsetof (coding_system_type_entry, meths), 1, &coding_system_methods_description },

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

366 { XD_END }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

367 };

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

368

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

369 static const struct struct_description cste_description = {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

370 sizeof (coding_system_type_entry),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

371 cste_description_1

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

372 };

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

373

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

374 static const struct lrecord_description csted_description_1[] = {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

375 XD_DYNARR_DESC (coding_system_type_entry_dynarr, &cste_description),

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

376 { XD_END }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

377 };

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

378

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

379 static const struct struct_description csted_description = {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

380 sizeof (coding_system_type_entry_dynarr),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

381 csted_description_1

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

382 };

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

383

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

384 static Lisp_Object Vcoding_system_type_list;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

385

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

386 /* Coding system currently associated with each coding category. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

387 Lisp_Object coding_category_system[MAX_DETECTOR_CATEGORIES];

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

388

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

389 /* Table of all coding categories in decreasing order of priority.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

390 This describes a permutation of the possible coding categories. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

391 int coding_category_by_priority[MAX_DETECTOR_CATEGORIES];

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

392

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

393 /* Value used with to give a unique name to nameless coding systems */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

394 int coding_system_tick;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

395

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

396 int coding_detector_count;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

397 int coding_detector_category_count;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

398

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

399 detector_dynarr *all_coding_detectors;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

400

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

401 static const struct lrecord_description struct_detector_category_description_1[]

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

402 =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

403 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

404 { XD_LISP_OBJECT, offsetof (struct detector_category, sym) },

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

405 { XD_END }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

406 };

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

407

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

408 static const struct struct_description struct_detector_category_description =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

409 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

410 sizeof (struct detector_category),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

411 struct_detector_category_description_1

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

412 };

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

413

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

414 static const struct lrecord_description detector_category_dynarr_description_1[] =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

415 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

416 XD_DYNARR_DESC (detector_category_dynarr,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

417 &struct_detector_category_description),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

418 { XD_END }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

419 };

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

420

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

421 static const struct struct_description detector_category_dynarr_description = {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

422 sizeof (detector_category_dynarr),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

423 detector_category_dynarr_description_1

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

424 };

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

425

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

426 static const struct lrecord_description struct_detector_description_1[]

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

427 =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

428 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

429 { XD_STRUCT_PTR, offsetof (struct detector, cats), 1,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

430 &detector_category_dynarr_description },

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

431 { XD_END }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

432 };

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

433

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

434 static const struct struct_description struct_detector_description =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

435 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

436 sizeof (struct detector),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

437 struct_detector_description_1

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

438 };

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

439

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

440 static const struct lrecord_description detector_dynarr_description_1[] =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

441 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

442 XD_DYNARR_DESC (detector_dynarr, &struct_detector_description),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

443 { XD_END }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

444 };

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

445

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

446 static const struct struct_description detector_dynarr_description = {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

447 sizeof (detector_dynarr),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

448 detector_dynarr_description_1

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

449 };

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

450

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

451 Lisp_Object Qcoding_systemp;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

452

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

453 Lisp_Object Qraw_text;

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

454

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

455 Lisp_Object Qmnemonic, Qeol_type;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

456 Lisp_Object Qcr, Qcrlf, Qlf;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

457 Lisp_Object Qeol_cr, Qeol_crlf, Qeol_lf;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

458 Lisp_Object Qpost_read_conversion;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

459 Lisp_Object Qpre_write_conversion;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

460

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

461 Lisp_Object Qtranslation_table_for_decode;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

462 Lisp_Object Qtranslation_table_for_encode;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

463 Lisp_Object Qsafe_chars;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

464 Lisp_Object Qsafe_charsets;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

465 Lisp_Object Qmime_charset;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

466 Lisp_Object Qvalid_codes;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

467

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

468 Lisp_Object Qno_conversion;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

469 Lisp_Object Qconvert_eol;

440

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

470 Lisp_Object Qescape_quoted;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

471 Lisp_Object Qencode, Qdecode;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

472

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

473 Lisp_Object Qconvert_eol_lf, Qconvert_eol_cr, Qconvert_eol_crlf;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

474 Lisp_Object Qconvert_eol_autodetect;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

475

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

476 Lisp_Object Qnear_certainty, Qquite_probable, Qsomewhat_likely;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

477 Lisp_Object Qas_likely_as_unlikely, Qsomewhat_unlikely, Qquite_improbable;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

478 Lisp_Object Qnearly_impossible;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

479

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

480 Lisp_Object Qdo_eol, Qdo_coding;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

481

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

482 Lisp_Object Qcanonicalize_after_coding;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

483

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

484 /* This is used to convert autodetected coding systems into existing

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

485 systems. For example, the chain undecided->convert-eol-autodetect may

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

486 have its separate parts detected as mswindows-multibyte and

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

487 convert-eol-crlf, and the result needs to be mapped to

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

488 mswindows-multibyte-dos. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

489 /* #### It's not clear we need this whole chain-canonicalize mechanism

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

490 any more. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

491 static Lisp_Object Vchain_canonicalize_hash_table;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

492

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

493 #ifdef HAVE_ZLIB

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

494 Lisp_Object Qgzip;

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

495 #endif

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

496

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

497 /* Maps coding system names to either coding system objects or (for

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

498 aliases) other names. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

499 static Lisp_Object Vcoding_system_hash_table;

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

500

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

501 int enable_multibyte_characters;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

502

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

503 EXFUN (Fcopy_coding_system, 2);

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

504

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

505

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

506 /************************************************************************/

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

507 /* Coding system object methods */

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

508 /************************************************************************/

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

509

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

510 static Lisp_Object

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

511 mark_coding_system (Lisp_Object obj)

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

512 {

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

513 Lisp_Coding_System *codesys = XCODING_SYSTEM (obj);

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

514

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

515 mark_object (CODING_SYSTEM_NAME (codesys));

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

516 mark_object (CODING_SYSTEM_DESCRIPTION (codesys));

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

517 mark_object (CODING_SYSTEM_MNEMONIC (codesys));

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

518 mark_object (CODING_SYSTEM_DOCUMENTATION (codesys));

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

519 mark_object (CODING_SYSTEM_EOL_LF (codesys));

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

520 mark_object (CODING_SYSTEM_EOL_CRLF (codesys));

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

521 mark_object (CODING_SYSTEM_EOL_CR (codesys));

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

522 mark_object (CODING_SYSTEM_SUBSIDIARY_PARENT (codesys));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

523 mark_object (CODING_SYSTEM_CANONICAL (codesys));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

524

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

525 MAYBE_CODESYSMETH (codesys, mark, (obj));

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

526

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

527 mark_object (CODING_SYSTEM_PRE_WRITE_CONVERSION (codesys));

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

528 return CODING_SYSTEM_POST_READ_CONVERSION (codesys);

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

529 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

530

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

531 static void

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

532 print_coding_system_properties (Lisp_Object obj, Lisp_Object printcharfun)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

533 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

534 Lisp_Coding_System *c = XCODING_SYSTEM (obj);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

535 print_internal (c->methods->type, printcharfun, 1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

536 MAYBE_CODESYSMETH (c, print, (obj, printcharfun, 1));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

537 if (CODING_SYSTEM_EOL_TYPE (c) != EOL_AUTODETECT)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

538 write_fmt_string_lisp (printcharfun, " eol-type=%s",

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

539 1, Fcoding_system_property (obj, Qeol_type));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

540 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

541

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

542 static void

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

543 print_coding_system (Lisp_Object obj, Lisp_Object printcharfun,

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

544 int escapeflag)

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

545 {

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

546 Lisp_Coding_System *c = XCODING_SYSTEM (obj);

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

547 if (print_readably)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

548 printing_unreadable_object

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

549 ("printing unreadable object #<coding-system 0x%x>", c->header.uid);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

550

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

551 write_fmt_string_lisp (printcharfun, "#<coding-system %s ", 1, c->name);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

552 print_coding_system_properties (obj, printcharfun);

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

553 write_c_string (printcharfun, ">");

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

554 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

555

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

556 /* Print an abbreviated version of a coding system (but still containing

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

557 all the information), for use within a coding system print method. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

558

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

559 static void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

560 print_coding_system_in_print_method (Lisp_Object cs, Lisp_Object printcharfun,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

561 int escapeflag)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

562 {

800

a5954632b187 [xemacs-hg @ 2002-03-31 08:27:14 by ben]

ben

parents: 793

diff changeset

563 write_fmt_string_lisp (printcharfun, "%s[", 1, XCODING_SYSTEM_NAME (cs));

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

564 print_coding_system_properties (cs, printcharfun);

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

565 write_c_string (printcharfun, "]");

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

566 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

567

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

568 static void

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

569 finalize_coding_system (void *header, int for_disksave)

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

570 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

571 Lisp_Object cs = wrap_coding_system ((Lisp_Coding_System *) header);

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

572 /* Since coding systems never go away, this function is not

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

573 necessary. But it would be necessary if we changed things

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

574 so that coding systems could go away. */

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

575 if (!for_disksave) /* see comment in lstream.c */

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

576 MAYBE_XCODESYSMETH (cs, finalize, (cs));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

577 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

578

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

579 static Bytecount

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

580 sizeof_coding_system (const void *header)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

581 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

582 const Lisp_Coding_System *p = (const Lisp_Coding_System *) header;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

583 return offsetof (Lisp_Coding_System, data) + p->methods->extra_data_size;

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

584 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

585

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

586 static const struct lrecord_description coding_system_methods_description_1[]

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

587 = {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

588 { XD_LISP_OBJECT,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

589 offsetof (struct coding_system_methods, type) },

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

590 { XD_LISP_OBJECT,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

591 offsetof (struct coding_system_methods, predicate_symbol) },

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

592 { XD_END }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

593 };

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

594

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

595 const struct struct_description coding_system_methods_description = {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

596 sizeof (struct coding_system_methods),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

597 coding_system_methods_description_1

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

598 };

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

599

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

600 const struct lrecord_description coding_system_empty_extra_description[] = {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

601 { XD_END }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

602 };

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

603

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

604 static const struct lrecord_description coding_system_description[] =

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

605 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

606 { XD_STRUCT_PTR, offsetof (Lisp_Coding_System, methods), 1,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

607 &coding_system_methods_description },

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

608 { XD_LISP_OBJECT, offsetof (Lisp_Coding_System, name) },

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

609 { XD_LISP_OBJECT, offsetof (Lisp_Coding_System, description) },

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

610 { XD_LISP_OBJECT, offsetof (Lisp_Coding_System, mnemonic) },

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

611 { XD_LISP_OBJECT, offsetof (Lisp_Coding_System, documentation) },

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

612 { XD_LISP_OBJECT, offsetof (Lisp_Coding_System, post_read_conversion) },

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

613 { XD_LISP_OBJECT, offsetof (Lisp_Coding_System, pre_write_conversion) },

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

614 { XD_LISP_OBJECT, offsetof (Lisp_Coding_System, text_file_wrapper) },

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

615 { XD_LISP_OBJECT, offsetof (Lisp_Coding_System, auto_eol_wrapper) },

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

616 { XD_LISP_OBJECT, offsetof (Lisp_Coding_System, eol[0]) },

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

617 { XD_LISP_OBJECT, offsetof (Lisp_Coding_System, eol[1]) },

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

618 { XD_LISP_OBJECT, offsetof (Lisp_Coding_System, eol[2]) },

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

619 { XD_LISP_OBJECT, offsetof (Lisp_Coding_System, subsidiary_parent) },

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

620 { XD_LISP_OBJECT, offsetof (Lisp_Coding_System, canonical) },

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

621 { XD_CODING_SYSTEM_END }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

622 };

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

623

934

c925bacdda60 [xemacs-hg @ 2002-07-29 09:21:12 by michaels]

michaels

parents: 867

diff changeset

624 #ifdef USE_KKCC

c925bacdda60 [xemacs-hg @ 2002-07-29 09:21:12 by michaels]

michaels

parents: 867

diff changeset

625 DEFINE_LRECORD_SEQUENCE_IMPLEMENTATION ("coding-system", coding_system,

c925bacdda60 [xemacs-hg @ 2002-07-29 09:21:12 by michaels]

michaels

parents: 867

diff changeset

626 1, /*dumpable-flag*/

c925bacdda60 [xemacs-hg @ 2002-07-29 09:21:12 by michaels]

michaels

parents: 867

diff changeset

627 mark_coding_system,

c925bacdda60 [xemacs-hg @ 2002-07-29 09:21:12 by michaels]

michaels

parents: 867

diff changeset

628 print_coding_system,

c925bacdda60 [xemacs-hg @ 2002-07-29 09:21:12 by michaels]

michaels

parents: 867

diff changeset

629 finalize_coding_system,

c925bacdda60 [xemacs-hg @ 2002-07-29 09:21:12 by michaels]

michaels

parents: 867

diff changeset

630 0, 0, coding_system_description,

c925bacdda60 [xemacs-hg @ 2002-07-29 09:21:12 by michaels]

michaels

parents: 867

diff changeset

631 sizeof_coding_system,

c925bacdda60 [xemacs-hg @ 2002-07-29 09:21:12 by michaels]

michaels

parents: 867

diff changeset

632 Lisp_Coding_System);

c925bacdda60 [xemacs-hg @ 2002-07-29 09:21:12 by michaels]

michaels

parents: 867

diff changeset

633 #else /* not USE_KKCC */

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

634 DEFINE_LRECORD_SEQUENCE_IMPLEMENTATION ("coding-system", coding_system,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

635 mark_coding_system,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

636 print_coding_system,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

637 finalize_coding_system,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

638 0, 0, coding_system_description,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

639 sizeof_coding_system,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

640 Lisp_Coding_System);

934

c925bacdda60 [xemacs-hg @ 2002-07-29 09:21:12 by michaels]

michaels

parents: 867

diff changeset

641 #endif /* not USE_KKCC */

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

642

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

643 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

644 /* Creating coding systems */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

645 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

646

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

647 static struct coding_system_methods *

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

648 decode_coding_system_type (Lisp_Object type, Error_Behavior errb)

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

649 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

650 int i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

651

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

652 for (i = 0; i < Dynarr_length (the_coding_system_type_entry_dynarr); i++)

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

653 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

654 if (EQ (type,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

655 Dynarr_at (the_coding_system_type_entry_dynarr, i).meths->type))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

656 return Dynarr_at (the_coding_system_type_entry_dynarr, i).meths;

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

657 }

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

658

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

659 maybe_invalid_constant ("Invalid coding system type", type,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

660 Qcoding_system, errb);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

661

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

662 return 0;

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

663 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

664

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

665 static int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

666 valid_coding_system_type_p (Lisp_Object type)

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

667 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

668 return decode_coding_system_type (type, ERROR_ME_NOT) != 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

669 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

670

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

671 DEFUN ("valid-coding-system-type-p", Fvalid_coding_system_type_p, 1, 1, 0, /*

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

672 Given a CODING-SYSTEM-TYPE, return non-nil if it is valid.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

673 Valid types depend on how XEmacs was compiled but may include

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

674 'undecided, 'chain, 'integer, 'ccl, 'iso2022, 'big5, 'shift-jis,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

675 'utf-16, 'ucs-4, 'utf-8, etc.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

676 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

677 (coding_system_type))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

678 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

679 return valid_coding_system_type_p (coding_system_type) ? Qt : Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

680 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

681

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

682 DEFUN ("coding-system-type-list", Fcoding_system_type_list, 0, 0, 0, /*

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

683 Return a list of valid coding system types.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

684 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

685 ())

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

686 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

687 return Fcopy_sequence (Vcoding_system_type_list);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

688 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

689

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

690 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

691 add_entry_to_coding_system_type_list (struct coding_system_methods *meths)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

692 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

693 struct coding_system_type_entry entry;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

694

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

695 entry.meths = meths;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

696 Dynarr_add (the_coding_system_type_entry_dynarr, entry);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

697 Vcoding_system_type_list = Fcons (meths->type, Vcoding_system_type_list);

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

698 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

699

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

700 DEFUN ("coding-system-p", Fcoding_system_p, 1, 1, 0, /*

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

701 Return t if OBJECT is a coding system.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

702 A coding system is an object that defines how text containing multiple

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

703 character sets is encoded into a stream of (typically 8-bit) bytes.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

704 The coding system is used to decode the stream into a series of

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

705 characters (which may be from multiple charsets) when the text is read

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

706 from a file or process, and is used to encode the text back into the

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

707 same format when it is written out to a file or process.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

708

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

709 For example, many ISO2022-compliant coding systems (such as Compound

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

710 Text, which is used for inter-client data under the X Window System)

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

711 use escape sequences to switch between different charsets -- Japanese

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

712 Kanji, for example, is invoked with "ESC $ ( B"; ASCII is invoked

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

713 with "ESC ( B"; and Cyrillic is invoked with "ESC - L". See

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

714 `make-coding-system' for more information.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

715

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

716 Coding systems are normally identified using a symbol, and the

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

717 symbol is accepted in place of the actual coding system object whenever

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

718 a coding system is called for. (This is similar to how faces work.)

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

719 */

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

720 (object))

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

721 {

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

722 return CODING_SYSTEMP (object) ? Qt : Qnil;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

723 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

724

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

725 DEFUN ("find-coding-system", Ffind_coding_system, 1, 1, 0, /*

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

726 Retrieve the coding system of the given name.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

727

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

728 If CODING-SYSTEM-OR-NAME is a coding-system object, it is simply

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

729 returned. Otherwise, CODING-SYSTEM-OR-NAME should be a symbol.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

730 If there is no such coding system, nil is returned. Otherwise the

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

731 associated coding system object is returned.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

732 */

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

733 (coding_system_or_name))

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

734 {

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

735 if (NILP (coding_system_or_name))

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

736 coding_system_or_name = Qbinary;

440

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

737 else if (CODING_SYSTEMP (coding_system_or_name))

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

738 return coding_system_or_name;

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

739 else

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

740 CHECK_SYMBOL (coding_system_or_name);

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

741

440

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

742 while (1)

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

743 {

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

744 coding_system_or_name =

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

745 Fgethash (coding_system_or_name, Vcoding_system_hash_table, Qnil);

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

746

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

747 if (CODING_SYSTEMP (coding_system_or_name)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

748 || NILP (coding_system_or_name))

440

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

749 return coding_system_or_name;

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

750 }

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

751 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

752

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

753 DEFUN ("get-coding-system", Fget_coding_system, 1, 1, 0, /*

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

754 Retrieve the coding system of the given name.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

755 Same as `find-coding-system' except that if there is no such

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

756 coding system, an error is signaled instead of returning nil.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

757 */

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

758 (name))

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

759 {

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

760 Lisp_Object coding_system = Ffind_coding_system (name);

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

761

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

762 if (NILP (coding_system))

563

183866b06e0b [xemacs-hg @ 2001-05-24 07:50:48 by ben]

ben

parents: 528

diff changeset

763 invalid_argument ("No such coding system", name);

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

764 return coding_system;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

765 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

766

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

767 int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

768 coding_system_is_binary (Lisp_Object coding_system)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

769 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

770 Lisp_Coding_System *cs = XCODING_SYSTEM (coding_system);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

771 return

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

772 (EQ (CODING_SYSTEM_TYPE (cs), Qno_conversion) &&

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

773 CODING_SYSTEM_EOL_TYPE (cs) == EOL_LF &&

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

774 EQ (CODING_SYSTEM_POST_READ_CONVERSION (cs), Qnil) &&

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

775 EQ (CODING_SYSTEM_PRE_WRITE_CONVERSION (cs), Qnil));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

776 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

777

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

778 static Lisp_Object

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

779 coding_system_real_canonical (Lisp_Object cs)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

780 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

781 if (!NILP (XCODING_SYSTEM_CANONICAL (cs)))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

782 return XCODING_SYSTEM_CANONICAL (cs);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

783 return cs;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

784 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

785

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

786 /* Return true if coding system is of the "standard" type that decodes

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

787 bytes into characters (suitable for decoding a text file). */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

788 int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

789 coding_system_is_for_text_file (Lisp_Object coding_system)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

790 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

791 return (XCODESYSMETH_OR_GIVEN

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

792 (coding_system, conversion_end_type,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

793 (coding_system_real_canonical (coding_system)),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

794 DECODES_BYTE_TO_CHARACTER) ==

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

795 DECODES_BYTE_TO_CHARACTER);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

796 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

797

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

798 static int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

799 decoding_source_sink_type_is_char (Lisp_Object cs, enum source_or_sink sex)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

800 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

801 enum source_sink_type type =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

802 XCODESYSMETH_OR_GIVEN (cs, conversion_end_type,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

803 (coding_system_real_canonical (cs)),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

804 DECODES_BYTE_TO_CHARACTER);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

805 if (sex == CODING_SOURCE)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

806 return (type == DECODES_CHARACTER_TO_CHARACTER ||

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

807 type == DECODES_CHARACTER_TO_BYTE);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

808 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

809 return (type == DECODES_CHARACTER_TO_CHARACTER ||

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

810 type == DECODES_BYTE_TO_CHARACTER);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

811 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

812

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

813 static int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

814 encoding_source_sink_type_is_char (Lisp_Object cs, enum source_or_sink sex)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

815 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

816 return decoding_source_sink_type_is_char (cs,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

817 /* Sex change */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

818 sex == CODING_SOURCE ?

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

819 CODING_SINK : CODING_SOURCE);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

820 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

821

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

822 /* Like Ffind_coding_system() but check that the coding system is of the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

823 "standard" type that decodes bytes into characters (suitable for

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

824 decoding a text file), and if not, returns an appropriate wrapper that

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

825 does. Also, if EOL_WRAP is non-zero, check whether this coding system

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

826 wants EOL auto-detection, and if so, wrap with a convert-eol coding

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

827 system to do this. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

828

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

829 Lisp_Object

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

830 find_coding_system_for_text_file (Lisp_Object name, int eol_wrap)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

831 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

832 Lisp_Object coding_system = Ffind_coding_system (name);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

833 Lisp_Object wrapper = coding_system;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

834

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

835 if (NILP (coding_system))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

836 return Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

837 if (!coding_system_is_for_text_file (coding_system))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

838 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

839 wrapper = XCODING_SYSTEM_TEXT_FILE_WRAPPER (coding_system);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

840 if (NILP (wrapper))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

841 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

842 Lisp_Object chain;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

843 if (!decoding_source_sink_type_is_char (coding_system, CODING_SINK))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

844 chain = list2 (coding_system, Qbinary);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

845 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

846 chain = list1 (coding_system);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

847 if (decoding_source_sink_type_is_char (coding_system, CODING_SOURCE))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

848 chain = Fcons (Qbinary, chain);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

849 wrapper =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

850 make_internal_coding_system

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

851 (coding_system,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

852 "internal-text-file-wrapper",

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

853 Qchain,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

854 Qunbound, list4 (Qchain, chain,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

855 Qcanonicalize_after_coding, coding_system));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

856 XCODING_SYSTEM_TEXT_FILE_WRAPPER (coding_system) = wrapper;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

857 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

858 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

859

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

860 if (!eol_wrap || XCODING_SYSTEM_EOL_TYPE (coding_system) != EOL_AUTODETECT)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

861 return wrapper;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

862

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

863 coding_system = wrapper;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

864 wrapper = XCODING_SYSTEM_AUTO_EOL_WRAPPER (coding_system);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

865 if (!NILP (wrapper))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

866 return wrapper;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

867 wrapper =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

868 make_internal_coding_system

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

869 (coding_system,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

870 "internal-auto-eol-wrapper",

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

871 Qundecided, Qunbound,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

872 list4 (Qcoding_system, coding_system,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

873 Qdo_eol, Qt));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

874 XCODING_SYSTEM_AUTO_EOL_WRAPPER (coding_system) = wrapper;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

875 return wrapper;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

876 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

877

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

878 /* Like Fget_coding_system() but verify that the coding system is of the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

879 "standard" type that decodes bytes into characters (suitable for

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

880 decoding a text file), and if not, returns an appropriate wrapper that

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

881 does. Also, if EOL_WRAP is non-zero, check whether this coding system

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

882 wants EOL auto-detection, and if so, wrap with a convert-eol coding

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

883 system to do this. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

884

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

885 Lisp_Object

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

886 get_coding_system_for_text_file (Lisp_Object name, int eol_wrap)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

887 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

888 Lisp_Object coding_system = find_coding_system_for_text_file (name,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

889 eol_wrap);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

890 if (NILP (coding_system))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

891 invalid_argument ("No such coding system", name);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

892 return coding_system;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

893 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

894

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

895 /* We store the coding systems in hash tables with the names as the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

896 key and the actual coding system object as the value. Occasionally

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

897 we need to use them in a list format. These routines provide us

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

898 with that. */

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

899 struct coding_system_list_closure

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

900 {

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

901 Lisp_Object *coding_system_list;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

902 int normal;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

903 int internal;

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

904 };

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

905

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

906 static int

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

907 add_coding_system_to_list_mapper (Lisp_Object key, Lisp_Object value,

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

908 void *coding_system_list_closure)

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

909 {

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

910 /* This function can GC */

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

911 struct coding_system_list_closure *cscl =

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

912 (struct coding_system_list_closure *) coding_system_list_closure;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

913 Lisp_Object *coding_system_list = cscl->coding_system_list;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

914

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

915 /* We can't just use VALUE because KEY might be an alias, and we need

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

916 the real coding system object. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

917 if (XCODING_SYSTEM (Ffind_coding_system (key))->internal_p ?

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

918 cscl->internal : cscl->normal)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

919 *coding_system_list = Fcons (key, *coding_system_list);

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

920 return 0;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

921 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

922

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

923 DEFUN ("coding-system-list", Fcoding_system_list, 0, 1, 0, /*

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

924 Return a list of the names of all defined coding systems.

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

925 If INTERNAL is nil, only the normal (non-internal) coding systems are

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

926 included. (Internal coding systems are created for various internal

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

927 purposes, such as implementing EOL types of CRLF and CR; generally, you do

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

928 not want to see these.) If it is t, only the internal coding systems are

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

929 included. If it is any other non-nil value both normal and internal are

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

930 included.

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

931 */

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

932 (internal))

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

933 {

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

934 Lisp_Object coding_system_list = Qnil;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

935 struct gcpro gcpro1;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

936 struct coding_system_list_closure coding_system_list_closure;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

937

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

938 GCPRO1 (coding_system_list);

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

939 coding_system_list_closure.coding_system_list = &coding_system_list;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

940 coding_system_list_closure.normal = !EQ (internal, Qt);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

941 coding_system_list_closure.internal = !NILP (internal);

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

942 elisp_maphash (add_coding_system_to_list_mapper, Vcoding_system_hash_table,

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

943 &coding_system_list_closure);

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

944 UNGCPRO;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

945

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

946 return coding_system_list;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

947 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

948

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

949 DEFUN ("coding-system-name", Fcoding_system_name, 1, 1, 0, /*

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

950 Return the name of the given coding system.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

951 */

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

952 (coding_system))

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

953 {

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

954 coding_system = Fget_coding_system (coding_system);

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

955 return XCODING_SYSTEM_NAME (coding_system);

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

956 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

957

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

958 static Lisp_Coding_System *

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

959 allocate_coding_system (struct coding_system_methods *codesys_meths,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

960 Bytecount data_size,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

961 Lisp_Object name)

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

962 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

963 Bytecount total_size = offsetof (Lisp_Coding_System, data) + data_size;

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

964 Lisp_Coding_System *codesys =

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

965 (Lisp_Coding_System *) alloc_lcrecord (total_size, &lrecord_coding_system);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

966

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

967 zero_sized_lcrecord (codesys, total_size);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

968 codesys->methods = codesys_meths;

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

969 CODING_SYSTEM_PRE_WRITE_CONVERSION (codesys) = Qnil;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

970 CODING_SYSTEM_POST_READ_CONVERSION (codesys) = Qnil;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

971 CODING_SYSTEM_EOL_TYPE (codesys) = EOL_LF;

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

972 CODING_SYSTEM_EOL_CRLF (codesys) = Qnil;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

973 CODING_SYSTEM_EOL_CR (codesys) = Qnil;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

974 CODING_SYSTEM_EOL_LF (codesys) = Qnil;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

975 CODING_SYSTEM_SUBSIDIARY_PARENT (codesys) = Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

976 CODING_SYSTEM_CANONICAL (codesys) = Qnil;

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

977 CODING_SYSTEM_MNEMONIC (codesys) = Qnil;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

978 CODING_SYSTEM_DOCUMENTATION (codesys) = Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

979 CODING_SYSTEM_TEXT_FILE_WRAPPER (codesys) = Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

980 CODING_SYSTEM_AUTO_EOL_WRAPPER (codesys) = Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

981 CODING_SYSTEM_NAME (codesys) = name;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

982

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

983 MAYBE_CODESYSMETH (codesys, init, (wrap_coding_system (codesys)));

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

984

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

985 return codesys;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

986 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

987

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

988 static enum eol_type

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

989 symbol_to_eol_type (Lisp_Object symbol)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

990 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

991 CHECK_SYMBOL (symbol);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

992 if (NILP (symbol)) return EOL_AUTODETECT;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

993 if (EQ (symbol, Qlf)) return EOL_LF;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

994 if (EQ (symbol, Qcrlf)) return EOL_CRLF;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

995 if (EQ (symbol, Qcr)) return EOL_CR;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

996

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

997 invalid_constant ("Unrecognized eol type", symbol);

801

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

998 RETURN_NOT_REACHED (EOL_AUTODETECT)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

999 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1000

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1001 static Lisp_Object

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1002 eol_type_to_symbol (enum eol_type type)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1003 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1004 switch (type)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1005 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1006 default: abort ();

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1007 case EOL_LF: return Qlf;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1008 case EOL_CRLF: return Qcrlf;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1009 case EOL_CR: return Qcr;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1010 case EOL_AUTODETECT: return Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1011 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1012 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1013

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1014 struct subsidiary_type

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1015 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1016 Char_ASCII *extension;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1017 Char_ASCII *mnemonic_ext;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1018 enum eol_type eol;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1019 };

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1020

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1021 static struct subsidiary_type coding_subsidiary_list[] =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1022 { { "-unix", "", EOL_LF },

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1023 { "-dos", ":T", EOL_CRLF },

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1024 { "-mac", ":t", EOL_CR } };

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1025

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1026 /* kludge */

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1027 static void

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1028 setup_eol_coding_systems (Lisp_Object codesys)

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1029 {

793

e38acbeb1cae [xemacs-hg @ 2002-03-29 04:46:17 by ben]

ben

parents: 778

diff changeset

1030 int len = XSTRING_LENGTH (XSYMBOL (XCODING_SYSTEM_NAME (codesys))->name);

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 851

diff changeset

1031 Ibyte *codesys_name = (Ibyte *) ALLOCA (len + 7);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1032 int mlen = -1;

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 851

diff changeset

1033 Ibyte *codesys_mnemonic = 0;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1034 Lisp_Object codesys_name_sym, sub_codesys;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1035 int i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1036

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1037 memcpy (codesys_name,

793

e38acbeb1cae [xemacs-hg @ 2002-03-29 04:46:17 by ben]

ben

parents: 778

diff changeset

1038 XSTRING_DATA (XSYMBOL (XCODING_SYSTEM_NAME (codesys))->name), len);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1039

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1040 if (STRINGP (XCODING_SYSTEM_MNEMONIC (codesys)))

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1041 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1042 mlen = XSTRING_LENGTH (XCODING_SYSTEM_MNEMONIC (codesys));

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 851

diff changeset

1043 codesys_mnemonic = (Ibyte *) ALLOCA (mlen + 7);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1044 memcpy (codesys_mnemonic,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1045 XSTRING_DATA (XCODING_SYSTEM_MNEMONIC (codesys)), mlen);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1046 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1047

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1048 /* Create three "subsidiary" coding systems, decoding data encoded using

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1049 each of the three EOL types. We do this for each subsidiary by

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1050 copying the original coding system, setting the EOL type

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1051 appropriately, and setting the CANONICAL member of the new coding

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1052 system to be a chain consisting of the original coding system followed

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1053 by a convert-eol coding system to do the EOL decoding. For EOL type

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1054 LF, however, we don't need any decoding, so we skip creating a

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1055 CANONICAL.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1056

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1057 If the original coding system is not a text-type coding system

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1058 (decodes byte->char), we need to coerce it to one by the appropriate

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1059 wrapping in CANONICAL. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1060

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1061 for (i = 0; i < countof (coding_subsidiary_list); i++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1062 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1063 Char_ASCII *extension = coding_subsidiary_list[i].extension;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1064 Char_ASCII *mnemonic_ext = coding_subsidiary_list[i].mnemonic_ext;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1065 enum eol_type eol = coding_subsidiary_list[i].eol;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1066

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1067 qxestrcpy_c (codesys_name + len, extension);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1068 codesys_name_sym = intern_int (codesys_name);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1069 if (mlen != -1)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1070 qxestrcpy_c (codesys_mnemonic + mlen, mnemonic_ext);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1071

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1072 sub_codesys = Fcopy_coding_system (codesys, codesys_name_sym);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1073 if (mlen != -1)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1074 XCODING_SYSTEM_MNEMONIC (sub_codesys) =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1075 build_intstring (codesys_mnemonic);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1076

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1077 if (eol != EOL_LF)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1078 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1079 Lisp_Object chain = list2 (get_coding_system_for_text_file

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1080 (codesys, 0),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1081 eol == EOL_CR ? Qconvert_eol_cr :

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1082 Qconvert_eol_crlf);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1083 Lisp_Object canon =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1084 make_internal_coding_system

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1085 (sub_codesys, "internal-subsidiary-eol-wrapper",

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1086 Qchain, Qunbound,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1087 mlen != -1 ?

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1088 list6 (Qmnemonic, build_intstring (codesys_mnemonic),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1089 Qchain, chain,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1090 Qcanonicalize_after_coding, sub_codesys) :

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1091 list4 (Qchain, chain,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1092 Qcanonicalize_after_coding, sub_codesys));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1093 XCODING_SYSTEM_CANONICAL (sub_codesys) = canon;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1094 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1095 XCODING_SYSTEM_EOL_TYPE (sub_codesys) = eol;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1096 XCODING_SYSTEM_SUBSIDIARY_PARENT (sub_codesys) = codesys;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1097 XCODING_SYSTEM (codesys)->eol[eol] = sub_codesys;

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1098 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1099 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1100

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1101 /* Basic function to create new coding systems. For `make-coding-system',

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1102 NAME-OR-EXISTING is the NAME argument, PREFIX is null, and TYPE,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1103 DESCRIPTION, and PROPS are the same. All created coding systems are put

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1104 in a hash table indexed by NAME.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1105

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1106 If PREFIX is a string, NAME-OR-EXISTING should specify an existing

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1107 coding system (or nil), and an internal coding system will be created.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1108 The name of the coding system will be constructed by combining PREFIX

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1109 with the name of the existing coding system (if given), and a number

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1110 will be appended to insure uniqueness. In such a case, if Qunbound is

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1111 given for DESCRIPTION, the description gets created based on the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1112 generated name. Also, if no mnemonic is given in the properties list, a

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1113 mnemonic is created based on the generated name.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1114

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1115 For internal coding systems, the coding system is marked as internal

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1116 (see `coding-system-list'), and no subsidiaries will be created or

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1117 eol-wrapping will happen. Otherwise:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1118

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1119 -- if the eol-type property is `lf' or t, the coding system is merely

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1120 created and returned. (For t, the coding system will be wrapped with

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1121 an EOL autodetector when it's used to read a file.)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1122

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1123 -- if eol-type is `crlf' or `cr', after the coding system object is

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1124 created, it will be wrapped in a chain with the appropriate

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1125 convert-eol coding system (either `convert-eol-crlf' or

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1126 `convert-eol-cr'), so that CRLF->LF or CR->LF conversion is done at

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1127 decoding time, and the opposite at encoding time. The resulting

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1128 chain becomes the CANONICAL field of the coding system object.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1129

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1130 -- if eol-type is nil or omitted, "subsidiaries" are generated: Three

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1131 coding systems where the original coding system (before wrapping with

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1132 convert-eol-autodetect) is either unwrapped or wrapped with

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1133 convert-eol-crlf or convert-eol-cr, respectively, so that coding systems

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1134 to handle LF, CRLF, and CR end-of-line indicators are created. (This

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1135 crazy crap is based on existing behavior in other Mule versions,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1136 including FSF Emacs.)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1137 */

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1138

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1139 static Lisp_Object

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1140 make_coding_system_1 (Lisp_Object name_or_existing, Char_ASCII *prefix,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1141 Lisp_Object type, Lisp_Object description,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1142 Lisp_Object props)

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1143 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1144 Lisp_Coding_System *cs;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1145 int need_to_setup_eol_systems = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1146 enum eol_type eol_wrapper = EOL_AUTODETECT;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1147 struct coding_system_methods *meths;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1148 Lisp_Object csobj;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1149 Lisp_Object defmnem = Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1150

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1151 if (NILP (type))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1152 type = Qundecided;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1153 meths = decode_coding_system_type (type, ERROR_ME);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1154

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1155 if (prefix)

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1156 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 851

diff changeset

1157 Ibyte *newname =

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1158 emacs_sprintf_malloc (NULL, "%s-%s-%d",

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1159 prefix,

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 851

diff changeset

1160 NILP (name_or_existing) ? (Ibyte *) "nil" :

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1161 XSTRING_DATA (Fsymbol_name (XCODING_SYSTEM_NAME

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1162 (name_or_existing))),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1163 ++coding_system_tick);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1164 name_or_existing = intern_int (newname);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1165 xfree (newname);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1166

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1167 if (UNBOUNDP (description))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1168 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1169 newname =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1170 emacs_sprintf_malloc

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1171 (NULL, "For Internal Use (%s)",

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1172 XSTRING_DATA (Fsymbol_name (name_or_existing)));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1173 description = build_intstring (newname);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1174 xfree (newname);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1175 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1176

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1177 newname = emacs_sprintf_malloc (NULL, "Int%d", coding_system_tick);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1178 defmnem = build_intstring (newname);

945

7924b28c57a4 [xemacs-hg @ 2002-08-01 08:38:32 by michaels]

michaels

parents: 934

diff changeset

1179 xfree (newname);

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1180 }

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1181 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1182 CHECK_SYMBOL (name_or_existing);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1183

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1184 if (!NILP (Ffind_coding_system (name_or_existing)))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1185 invalid_operation ("Cannot redefine existing coding system",

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1186 name_or_existing);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1187

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1188 cs = allocate_coding_system (meths, meths->extra_data_size,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1189 name_or_existing);

793

e38acbeb1cae [xemacs-hg @ 2002-03-29 04:46:17 by ben]

ben

parents: 778

diff changeset

1190 csobj = wrap_coding_system (cs);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1191

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1192 cs->internal_p = !!prefix;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1193

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1194 if (NILP (description))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1195 description = build_string ("");

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1196 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1197 CHECK_STRING (description);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1198 CODING_SYSTEM_DESCRIPTION (cs) = description;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1199

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1200 if (!NILP (defmnem))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1201 CODING_SYSTEM_MNEMONIC (cs) = defmnem;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1202

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1203 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1204 EXTERNAL_PROPERTY_LIST_LOOP_3 (key, value, props)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1205 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1206 int recognized = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1207

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1208 if (EQ (key, Qmnemonic))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1209 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1210 if (!NILP (value))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1211 CHECK_STRING (value);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1212 CODING_SYSTEM_MNEMONIC (cs) = value;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1213 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1214

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1215 else if (EQ (key, Qdocumentation))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1216 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1217 if (!NILP (value))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1218 CHECK_STRING (value);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1219 CODING_SYSTEM_DOCUMENTATION (cs) = value;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1220 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1221

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1222 else if (EQ (key, Qeol_type))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1223 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1224 need_to_setup_eol_systems = NILP (value);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1225 if (EQ (value, Qt))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1226 value = Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1227 eol_wrapper = symbol_to_eol_type (value);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1228 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1229

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1230 else if (EQ (key, Qpost_read_conversion))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1231 CODING_SYSTEM_POST_READ_CONVERSION (cs) = value;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1232 else if (EQ (key, Qpre_write_conversion))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1233 CODING_SYSTEM_PRE_WRITE_CONVERSION (cs) = value;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1234 /* FSF compatibility */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1235 else if (EQ (key, Qtranslation_table_for_decode))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1236 ;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1237 else if (EQ (key, Qtranslation_table_for_encode))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1238 ;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1239 else if (EQ (key, Qsafe_chars))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1240 ;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1241 else if (EQ (key, Qsafe_charsets))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1242 ;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1243 else if (EQ (key, Qmime_charset))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1244 ;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1245 else if (EQ (key, Qvalid_codes))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1246 ;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1247 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1248 recognized = CODESYSMETH_OR_GIVEN (cs, putprop,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1249 (csobj, key, value), 0);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1250

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1251 if (!recognized)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1252 invalid_constant ("Unrecognized property", key);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1253 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1254 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1255

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1256 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1257 XCODING_SYSTEM_CANONICAL (csobj) =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1258 CODESYSMETH_OR_GIVEN (cs, canonicalize, (csobj), Qnil);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1259 XCODING_SYSTEM_EOL_TYPE (csobj) = EOL_AUTODETECT; /* for copy-coding-system

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1260 below */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1261

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1262 if (need_to_setup_eol_systems && !cs->internal_p)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1263 setup_eol_coding_systems (csobj);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1264 else if (eol_wrapper == EOL_CR || eol_wrapper == EOL_CRLF)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1265 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1266 /* If a specific eol-type (other than LF) was specified, we handle

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1267 this by converting the coding system into a chain that wraps the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1268 coding system along with a convert-eol system after it, in

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1269 exactly that same switcheroo fashion that the normal

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1270 canonicalize method works -- BUT we will run into a problem if

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1271 we do it the obvious way, because when `chain' creates its

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1272 substreams, the substream containing the coding system we're

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1273 creating will have canonicalization expansion done on it,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1274 leading to infinite recursion. So we have to generate a new,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1275 internal coding system with the previous value of CANONICAL. */

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 851

diff changeset

1276 Ibyte *newname =

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1277 emacs_sprintf_malloc

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1278 (NULL, "internal-eol-copy-%s-%d",

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1279 XSTRING_DATA (Fsymbol_name (name_or_existing)),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1280 ++coding_system_tick);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1281 Lisp_Object newnamesym = intern_int (newname);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1282 Lisp_Object copied = Fcopy_coding_system (csobj, newnamesym);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1283 xfree (newname);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1284

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1285 XCODING_SYSTEM_CANONICAL (csobj) =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1286 make_internal_coding_system

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1287 (csobj,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1288 "internal-eol-wrapper",

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1289 Qchain, Qunbound,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1290 list4 (Qchain,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1291 list2 (copied,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1292 eol_wrapper == EOL_CR ?

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1293 Qconvert_eol_cr :

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1294 Qconvert_eol_crlf),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1295 Qcanonicalize_after_coding,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1296 csobj));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1297 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1298 XCODING_SYSTEM_EOL_TYPE (csobj) = eol_wrapper;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1299 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1300

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1301 Fputhash (name_or_existing, csobj, Vcoding_system_hash_table);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1302

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1303 return csobj;

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1304 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1305

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1306 Lisp_Object

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1307 make_internal_coding_system (Lisp_Object existing, Char_ASCII *prefix,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1308 Lisp_Object type, Lisp_Object description,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1309 Lisp_Object props)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1310 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1311 return make_coding_system_1 (existing, prefix, type, description, props);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1312 }

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1313

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1314 DEFUN ("make-coding-system", Fmake_coding_system, 2, 4, 0, /*

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1315 Register symbol NAME as a coding system.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1316

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1317 TYPE describes the conversion method used and should be one of

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1318

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1319 nil or 'undecided

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1320 Automatic conversion. XEmacs attempts to detect the coding system

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1321 used in the file.

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1322 'chain

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1323 Chain two or more coding systems together to make a combination coding

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1324 system.

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1325 'no-conversion

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1326 No conversion. Use this for binary files and such. On output,

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1327 graphic characters that are not in ASCII or Latin-1 will be

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1328 replaced by a ?. (For a no-conversion-encoded buffer, these

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1329 characters will only be present if you explicitly insert them.)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1330 'convert-eol

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1331 Convert CRLF sequences or CR to LF.

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1332 'shift-jis

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1333 Shift-JIS (a Japanese encoding commonly used in PC operating systems).

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1334 'unicode

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1335 Any Unicode encoding (UCS-4, UTF-8, UTF-16, etc.).

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1336 'mswindows-unicode-to-multibyte

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1337 (MS Windows only) Converts from Windows Unicode to Windows Multibyte

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1338 (any code page encoding) upon encoding, and the other way upon decoding.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1339 'mswindows-multibyte

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1340 Converts to or from Windows Multibyte (any code page encoding).

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1341 This is resolved into a chain of `mswindows-unicode' and

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1342 `mswindows-unicode-to-multibyte'.

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1343 'iso2022

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1344 Any ISO2022-compliant encoding. Among other things, this includes

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1345 JIS (the Japanese encoding commonly used for e-mail), EUC (the

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1346 standard Unix encoding for Japanese and other languages), and

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1347 Compound Text (the encoding used in X11). You can specify more

442

abe6d1db359e Import from CVS: tag r21-2-36

cvs

parents: 440

diff changeset

1348 specific information about the conversion with the PROPS argument.

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1349 'big5

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1350 Big5 (the encoding commonly used for Taiwanese).

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1351 'ccl

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1352 The conversion is performed using a user-written pseudo-code

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1353 program. CCL (Code Conversion Language) is the name of this

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1354 pseudo-code.

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1355 'gzip

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1356 GZIP compression format.

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1357 'internal

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1358 Write out or read in the raw contents of the memory representing

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1359 the buffer's text. This is primarily useful for debugging

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1360 purposes, and is only enabled when XEmacs has been compiled with

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1361 DEBUG_XEMACS defined (via the --debug configure option).

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1362 WARNING: Reading in a file using 'internal conversion can result

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1363 in an internal inconsistency in the memory representing a

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1364 buffer's text, which will produce unpredictable results and may

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1365 cause XEmacs to crash. Under normal circumstances you should

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1366 never use 'internal conversion.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1367

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1368 DESCRIPTION is a short English phrase describing the coding system,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1369 suitable for use as a menu item. (See also the `documentation' property

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1370 below.)

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1371

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1372 PROPS is a property list, describing the specific nature of the

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1373 character set. Recognized properties are:

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1374

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1375 'mnemonic

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1376 String to be displayed in the modeline when this coding system is

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1377 active.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1378

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1379 'documentation

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1380 Detailed documentation on the coding system.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1381

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1382 'eol-type

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1383 End-of-line conversion to be used. It should be one of

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1384

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1385 nil

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1386 Automatically detect the end-of-line type (LF, CRLF,

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1387 or CR). Also generate subsidiary coding systems named

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1388 `NAME-unix', `NAME-dos', and `NAME-mac', that are

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1389 identical to this coding system but have an EOL-TYPE

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1390 value of 'lf, 'crlf, and 'cr, respectively.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1391 'lf

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1392 The end of a line is marked externally using ASCII LF.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1393 Since this is also the way that XEmacs represents an

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1394 end-of-line internally, specifying this option results

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1395 in no end-of-line conversion. This is the standard

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1396 format for Unix text files.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1397 'crlf

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1398 The end of a line is marked externally using ASCII

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1399 CRLF. This is the standard format for MS-DOS text

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1400 files.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1401 'cr

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1402 The end of a line is marked externally using ASCII CR.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1403 This is the standard format for Macintosh text files.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1404 t

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1405 Automatically detect the end-of-line type but do not

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1406 generate subsidiary coding systems. (This value is

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1407 converted to nil when stored internally, and

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1408 `coding-system-property' will return nil.)

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1409

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1410 'post-read-conversion

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1411 The value is a function to call after some text is inserted and

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1412 decoded by the coding system itself and before any functions in

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1413 `after-change-functions' are called. (#### Not actually true in

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1414 XEmacs. `after-change-functions' will be called twice if

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1415 `post-read-conversion' changes something.) The argument of this

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1416 function is the same as for a function in

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1417 `after-insert-file-functions', i.e. LENGTH of the text inserted,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1418 with point at the head of the text to be decoded.

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1419

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1420 'pre-write-conversion

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1421 The value is a function to call after all functions in

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1422 `write-region-annotate-functions' and `buffer-file-format' are

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1423 called, and before the text is encoded by the coding system itself.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1424 The arguments to this function are the same as those of a function

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1425 in `write-region-annotate-functions', i.e. FROM and TO, specifying

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1426 a region of text.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1427

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1428

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1429

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1430 The following properties are allowed for FSF compatibility but currently

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1431 ignored:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1432

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1433 'translation-table-for-decode

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1434 The value is a translation table to be applied on decoding. See

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1435 the function `make-translation-table' for the format of translation

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1436 table. This is not applicable to CCL-based coding systems.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1437

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1438 'translation-table-for-encode

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1439 The value is a translation table to be applied on encoding. This is

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1440 not applicable to CCL-based coding systems.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1441

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1442 'safe-chars

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1443 The value is a char table. If a character has non-nil value in it,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1444 the character is safely supported by the coding system. This

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1445 overrides the specification of safe-charsets.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1446

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1447 'safe-charsets

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1448 The value is a list of charsets safely supported by the coding

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1449 system. The value t means that all charsets Emacs handles are

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1450 supported. Even if some charset is not in this list, it doesn't

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1451 mean that the charset can't be encoded in the coding system;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1452 it just means that some other receiver of text encoded

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1453 in the coding system won't be able to handle that charset.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1454

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1455 'mime-charset

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1456 The value is a symbol of which name is `MIME-charset' parameter of

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1457 the coding system.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1458

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1459 'valid-codes (meaningful only for a coding system based on CCL)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1460 The value is a list to indicate valid byte ranges of the encoded

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1461 file. Each element of the list is an integer or a cons of integer.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1462 In the former case, the integer value is a valid byte code. In the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1463 latter case, the integers specifies the range of valid byte codes.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1464

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1465

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1466

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1467 The following additional property is recognized if TYPE is 'convert-eol:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1468

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1469 'subtype

793

e38acbeb1cae [xemacs-hg @ 2002-03-29 04:46:17 by ben]

ben

parents: 778

diff changeset

1470 One of `lf', `crlf', `cr' or nil (for autodetection). When decoding,

e38acbeb1cae [xemacs-hg @ 2002-03-29 04:46:17 by ben]

ben

parents: 778

diff changeset

1471 the corresponding sequence will be converted to LF. When encoding,

e38acbeb1cae [xemacs-hg @ 2002-03-29 04:46:17 by ben]

ben

parents: 778

diff changeset

1472 the opposite happens. This coding system converts characters to

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1473 characters.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1474

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1475

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1476

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1477 The following additional properties are recognized if TYPE is 'iso2022:

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1478

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1479 'charset-g0

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1480 'charset-g1

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1481 'charset-g2

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1482 'charset-g3

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1483 The character set initially designated to the G0 - G3 registers.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1484 The value should be one of

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1485

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1486 -- A charset object (designate that character set)

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1487 -- nil (do not ever use this register)

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1488 -- t (no character set is initially designated to

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1489 the register, but may be later on; this automatically

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1490 sets the corresponding `force-g*-on-output' property)

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1491

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1492 'force-g0-on-output

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1493 'force-g1-on-output

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1494 'force-g2-on-output

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1495 'force-g2-on-output

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1496 If non-nil, send an explicit designation sequence on output before

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1497 using the specified register.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1498

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1499 'short

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1500 If non-nil, use the short forms "ESC $ @", "ESC $ A", and

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1501 "ESC $ B" on output in place of the full designation sequences

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1502 "ESC $ ( @", "ESC $ ( A", and "ESC $ ( B".

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1503

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1504 'no-ascii-eol

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1505 If non-nil, don't designate ASCII to G0 at each end of line on output.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1506 Setting this to non-nil also suppresses other state-resetting that

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1507 normally happens at the end of a line.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1508

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1509 'no-ascii-cntl

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1510 If non-nil, don't designate ASCII to G0 before control chars on output.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1511

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1512 'seven

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1513 If non-nil, use 7-bit environment on output. Otherwise, use 8-bit

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1514 environment.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1515

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1516 'lock-shift

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1517 If non-nil, use locking-shift (SO/SI) instead of single-shift

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1518 or designation by escape sequence.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1519

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1520 'no-iso6429

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1521 If non-nil, don't use ISO6429's direction specification.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1522

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1523 'escape-quoted

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1524 If non-nil, literal control characters that are the same as

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1525 the beginning of a recognized ISO2022 or ISO6429 escape sequence

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1526 (in particular, ESC (0x1B), SO (0x0E), SI (0x0F), SS2 (0x8E),

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1527 SS3 (0x8F), and CSI (0x9B)) are "quoted" with an escape character

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1528 so that they can be properly distinguished from an escape sequence.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1529 (Note that doing this results in a non-portable encoding.) This

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1530 encoding flag is used for byte-compiled files. Note that ESC

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1531 is a good choice for a quoting character because there are no

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1532 escape sequences whose second byte is a character from the Control-0

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1533 or Control-1 character sets; this is explicitly disallowed by the

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1534 ISO2022 standard.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1535

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1536 'input-charset-conversion

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1537 A list of conversion specifications, specifying conversion of

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1538 characters in one charset to another when decoding is performed.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1539 Each specification is a list of two elements: the source charset,

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1540 and the destination charset.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1541

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1542 'output-charset-conversion

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1543 A list of conversion specifications, specifying conversion of

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1544 characters in one charset to another when encoding is performed.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1545 The form of each specification is the same as for

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1546 'input-charset-conversion.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1547

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1548

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1549

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1550 The following additional properties are recognized (and required)

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1551 if TYPE is 'ccl:

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1552

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1553 'decode

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1554 CCL program used for decoding (converting to internal format).

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1555

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1556 'encode

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1557 CCL program used for encoding (converting to external format).

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1558

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1559

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1560 The following additional properties are recognized if TYPE is 'chain:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1561

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1562 'chain

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1563 List of coding systems to be chained together, in decoding order.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1564

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1565 'canonicalize-after-coding

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1566 Coding system to be returned by the detector routines in place of

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1567 this coding system.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1568

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1569

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1570

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1571 The following additional properties are recognized if TYPE is 'unicode:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1572

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1573 'type

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1574 One of `utf-16', `utf-8', `ucs-4', or `utf-7' (the latter is not

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1575 yet implemented). `utf-16' is the basic two-byte encoding;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1576 `ucs-4' is the four-byte encoding; `utf-8' is an ASCII-compatible

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1577 variable-width 8-bit encoding; `utf-7' is a 7-bit encoding using

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1578 only characters that will safely pass through all mail gateways.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1579

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1580 'little-endian

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1581 If non-nil, `utf-16' and `ucs-4' will write out the groups of two

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1582 or four bytes little-endian instead of big-endian. This is required,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1583 for example, under Windows.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1584

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1585 'need-bom

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1586 If non-nil, a byte order mark (BOM, or Unicode FFFE) should be

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1587 written out at the beginning of the data. This serves both to

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1588 identify the endianness of the following data and to mark the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1589 data as Unicode (at least, this is how Windows uses it).

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1590

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1591

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1592

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1593 The following additional properties are recognized if TYPE is

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1594 'mswindows-multibyte:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1595

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1596 'code-page

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1597 Either a number (specifying a particular code page) or one of the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1598 symbols `ansi', `oem', `mac', or `ebcdic', specifying the ANSI,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1599 OEM, Macintosh, or EBCDIC code page associated with a particular

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1600 locale (given by the `locale' property). NOTE: EBCDIC code pages

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1601 only exist in Windows 2000 and later.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1602

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1603 'locale

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1604 If `code-page' is a symbol, this specifies the locale whose code

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1605 page of the corresponding type should be used. This should be

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1606 one of the following: A cons of two strings, (LANGUAGE

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1607 . SUBLANGUAGE) (see `mswindows-set-current-locale'); a string (a

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1608 language; SUBLANG_DEFAULT, i.e. the default sublanguage, is

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1609 used); or one of the symbols `current', `user-default', or

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1610 `system-default', corresponding to the values of

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1611 `mswindows-current-locale', `mswindows-user-default-locale', or

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1612 `mswindows-system-default-locale', respectively.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1613

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1614

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1615

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1616 The following additional properties are recognized if TYPE is 'undecided:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1617

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1618 'do-eol

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1619 Do EOL detection.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1620

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1621 'do-coding

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1622 Do encoding detection.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1623

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1624 'coding-system

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1625 If encoding detection is not done, use the specified coding system

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1626 to do decoding. This is used internally when implementing coding

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1627 systems with an EOL type that specifies autodetection (the default),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1628 so that the detector routines return the proper subsidiary.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1629

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1630

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1631

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1632 The following additional property is recognized if TYPE is 'gzip:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1633

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1634 'level

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1635 Compression level: 0 through 9, or `default' (currently 6).

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1636

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1637 */

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1638 (name, type, description, props))

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1639 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1640 return make_coding_system_1 (name, 0, type, description, props);

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1641 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1642

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1643 DEFUN ("copy-coding-system", Fcopy_coding_system, 2, 2, 0, /*

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1644 Copy OLD-CODING-SYSTEM to NEW-NAME.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1645 If NEW-NAME does not name an existing coding system, a new one will

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1646 be created.

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1647 If you are using this function to create an alias, think again:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1648 Use `define-coding-system-alias' instead.

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1649 */

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1650 (old_coding_system, new_name))

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1651 {

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1652 Lisp_Object new_coding_system;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1653 old_coding_system = Fget_coding_system (old_coding_system);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1654 new_coding_system =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1655 UNBOUNDP (new_name) ? Qnil : Ffind_coding_system (new_name);

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1656 if (NILP (new_coding_system))

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1657 {

793

e38acbeb1cae [xemacs-hg @ 2002-03-29 04:46:17 by ben]

ben

parents: 778

diff changeset

1658 new_coding_system =

e38acbeb1cae [xemacs-hg @ 2002-03-29 04:46:17 by ben]

ben

parents: 778

diff changeset

1659 wrap_coding_system

e38acbeb1cae [xemacs-hg @ 2002-03-29 04:46:17 by ben]

ben

parents: 778

diff changeset

1660 (allocate_coding_system

e38acbeb1cae [xemacs-hg @ 2002-03-29 04:46:17 by ben]

ben

parents: 778

diff changeset

1661 (XCODING_SYSTEM (old_coding_system)->methods,

e38acbeb1cae [xemacs-hg @ 2002-03-29 04:46:17 by ben]

ben

parents: 778

diff changeset

1662 XCODING_SYSTEM (old_coding_system)->methods->extra_data_size,

e38acbeb1cae [xemacs-hg @ 2002-03-29 04:46:17 by ben]

ben

parents: 778

diff changeset

1663 new_name));

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1664 if (!UNBOUNDP (new_name))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1665 Fputhash (new_name, new_coding_system, Vcoding_system_hash_table);

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1666 }

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1667 else if (XCODING_SYSTEM (old_coding_system)->methods !=

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1668 XCODING_SYSTEM (new_coding_system)->methods)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1669 invalid_operation_2 ("Coding systems not same type",

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1670 old_coding_system, new_coding_system);

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1671

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1672 {

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1673 Lisp_Coding_System *to = XCODING_SYSTEM (new_coding_system);

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1674 Lisp_Coding_System *from = XCODING_SYSTEM (old_coding_system);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1675 copy_sized_lcrecord (to, from, sizeof_coding_system (from));

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1676 to->name = new_name;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1677 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1678 return new_coding_system;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1679 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1680

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1681 DEFUN ("coding-system-canonical-name-p", Fcoding_system_canonical_name_p,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1682 1, 1, 0, /*

440

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1683 Return t if OBJECT names a coding system, and is not a coding system alias.

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1684 */

440

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1685 (object))

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1686 {

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1687 return CODING_SYSTEMP (Fgethash (object, Vcoding_system_hash_table, Qnil))

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1688 ? Qt : Qnil;

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1689 }

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1690

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1691 DEFUN ("coding-system-alias-p", Fcoding_system_alias_p, 1, 1, 0, /*

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1692 Return t if OBJECT is a coding system alias.

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1693 All coding system aliases are created by `define-coding-system-alias'.

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1694 */

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1695 (object))

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1696 {

440

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1697 return SYMBOLP (Fgethash (object, Vcoding_system_hash_table, Qzero))

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1698 ? Qt : Qnil;

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1699 }

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1700

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1701 DEFUN ("coding-system-aliasee", Fcoding_system_aliasee, 1, 1, 0, /*

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1702 Return the coding-system symbol for which symbol ALIAS is an alias.

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1703 */

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1704 (alias))

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1705 {

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1706 Lisp_Object aliasee = Fgethash (alias, Vcoding_system_hash_table, Qnil);

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1707 if (SYMBOLP (aliasee))

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1708 return aliasee;

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1709 else

563

183866b06e0b [xemacs-hg @ 2001-05-24 07:50:48 by ben]

ben

parents: 528

diff changeset

1710 invalid_argument ("Symbol is not a coding system alias", alias);

801

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

1711 RETURN_NOT_REACHED (Qnil)

440

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1712 }

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1713

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1714 /* A maphash function, for removing dangling coding system aliases. */

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1715 static int

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1716 dangling_coding_system_alias_p (Lisp_Object alias,

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1717 Lisp_Object aliasee,

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1718 void *dangling_aliases)

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1719 {

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1720 if (SYMBOLP (aliasee)

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1721 && NILP (Fgethash (aliasee, Vcoding_system_hash_table, Qnil)))

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1722 {

440

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1723 (*(int *) dangling_aliases)++;

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1724 return 1;

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1725 }

440

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1726 else

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1727 return 0;

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1728 }

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1729

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1730 DEFUN ("define-coding-system-alias", Fdefine_coding_system_alias, 2, 2, 0, /*

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1731 Define symbol ALIAS as an alias for coding system ALIASEE.

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1732

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1733 You can use this function to redefine an alias that has already been defined,

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1734 but you cannot redefine a name which is the canonical name for a coding system.

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1735 \(a canonical name of a coding system is what is returned when you call

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1736 `coding-system-name' on a coding system).

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1737

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1738 ALIASEE itself can be an alias, which allows you to define nested aliases.

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1739

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1740 You are forbidden, however, from creating alias loops or `dangling' aliases.

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1741 These will be detected, and an error will be signaled if you attempt to do so.

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1742

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1743 If ALIASEE is nil, then ALIAS will simply be undefined.

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1744

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1745 See also `coding-system-alias-p', `coding-system-aliasee',

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1746 and `coding-system-canonical-name-p'.

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1747 */

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1748 (alias, aliasee))

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1749 {

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1750 Lisp_Object real_coding_system, probe;

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1751

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1752 CHECK_SYMBOL (alias);

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1753

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1754 if (!NILP (Fcoding_system_canonical_name_p (alias)))

563

183866b06e0b [xemacs-hg @ 2001-05-24 07:50:48 by ben]

ben

parents: 528

diff changeset

1755 invalid_change

440

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1756 ("Symbol is the canonical name of a coding system and cannot be redefined",

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1757 alias);

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1758

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1759 if (NILP (aliasee))

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1760 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1761 Lisp_Object subsidiary_unix = add_suffix_to_symbol (alias, "-unix");

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1762 Lisp_Object subsidiary_dos = add_suffix_to_symbol (alias, "-dos");

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1763 Lisp_Object subsidiary_mac = add_suffix_to_symbol (alias, "-mac");

440

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1764

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1765 Fremhash (alias, Vcoding_system_hash_table);

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1766

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1767 /* Undefine subsidiary aliases,

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1768 presumably created by a previous call to this function */

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1769 if (! NILP (Fcoding_system_alias_p (subsidiary_unix)) &&

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1770 ! NILP (Fcoding_system_alias_p (subsidiary_dos)) &&

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1771 ! NILP (Fcoding_system_alias_p (subsidiary_mac)))

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1772 {

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1773 Fdefine_coding_system_alias (subsidiary_unix, Qnil);

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1774 Fdefine_coding_system_alias (subsidiary_dos, Qnil);

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1775 Fdefine_coding_system_alias (subsidiary_mac, Qnil);

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1776 }

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1777

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1778 /* Undefine dangling coding system aliases. */

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1779 {

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1780 int dangling_aliases;

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1781

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1782 do {

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1783 dangling_aliases = 0;

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1784 elisp_map_remhash (dangling_coding_system_alias_p,

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1785 Vcoding_system_hash_table,

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1786 &dangling_aliases);

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1787 } while (dangling_aliases > 0);

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1788 }

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1789

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1790 return Qnil;

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1791 }

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1792

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1793 if (CODING_SYSTEMP (aliasee))

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1794 aliasee = XCODING_SYSTEM_NAME (aliasee);

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1795

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1796 /* Checks that aliasee names a coding-system */

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1797 real_coding_system = Fget_coding_system (aliasee);

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1798

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1799 /* Check for coding system alias loops */

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1800 if (EQ (alias, aliasee))

563

183866b06e0b [xemacs-hg @ 2001-05-24 07:50:48 by ben]

ben

parents: 528

diff changeset

1801 alias_loop: invalid_operation_2

440

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1802 ("Attempt to create a coding system alias loop", alias, aliasee);

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1803

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1804 for (probe = aliasee;

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1805 SYMBOLP (probe);

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1806 probe = Fgethash (probe, Vcoding_system_hash_table, Qzero))

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1807 {

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1808 if (EQ (probe, alias))

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1809 goto alias_loop;

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1810 }

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1811

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1812 Fputhash (alias, aliasee, Vcoding_system_hash_table);

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1813

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1814 /* Set up aliases for subsidiaries.

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1815 #### There must be a better way to handle subsidiary coding systems. */

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1816 {

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1817 static const char *suffixes[] = { "-unix", "-dos", "-mac" };

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1818 int i;

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1819 for (i = 0; i < countof (suffixes); i++)

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1820 {

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1821 Lisp_Object alias_subsidiary =

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1822 add_suffix_to_symbol (alias, suffixes[i]);

440

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1823 Lisp_Object aliasee_subsidiary =

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1824 add_suffix_to_symbol (aliasee, suffixes[i]);

440

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1825

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1826 if (! NILP (Ffind_coding_system (aliasee_subsidiary)))

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1827 Fdefine_coding_system_alias (alias_subsidiary, aliasee_subsidiary);

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1828 }

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

1829 }

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1830 /* FSF return value is a vector of [ALIAS-unix ALIAS-dos ALIAS-mac],

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1831 but it doesn't look intentional, so I'd rather return something

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1832 meaningful or nothing at all. */

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1833 return Qnil;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1834 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1835

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1836 static Lisp_Object

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1837 subsidiary_coding_system (Lisp_Object coding_system, enum eol_type type)

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1838 {

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1839 Lisp_Coding_System *cs = XCODING_SYSTEM (coding_system);

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1840 Lisp_Object new_coding_system;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1841

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1842 switch (type)

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1843 {

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1844 case EOL_AUTODETECT: return coding_system;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1845 case EOL_LF: new_coding_system = CODING_SYSTEM_EOL_LF (cs); break;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1846 case EOL_CR: new_coding_system = CODING_SYSTEM_EOL_CR (cs); break;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1847 case EOL_CRLF: new_coding_system = CODING_SYSTEM_EOL_CRLF (cs); break;

442

abe6d1db359e Import from CVS: tag r21-2-36

cvs

parents: 440

diff changeset

1848 default: abort (); return Qnil;

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1849 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1850

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1851 return NILP (new_coding_system) ? coding_system : new_coding_system;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1852 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1853

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1854 DEFUN ("subsidiary-coding-system", Fsubsidiary_coding_system, 2, 2, 0, /*

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1855 Return the subsidiary coding system of CODING-SYSTEM with eol type EOL-TYPE.

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1856 The logically opposite operation is `coding-system-base'.

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1857 */

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1858 (coding_system, eol_type))

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1859 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1860 coding_system = get_coding_system_for_text_file (coding_system, 0);

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1861

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1862 return subsidiary_coding_system (coding_system,

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1863 symbol_to_eol_type (eol_type));

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1864 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1865

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1866 DEFUN ("coding-system-base", Fcoding_system_base,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1867 1, 1, 0, /*

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1868 Return the base coding system of CODING-SYSTEM.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1869 If CODING-SYSTEM is a subsidiary, this returns its parent; otherwise, it

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1870 returns CODING-SYSTEM.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1871 The logically opposite operation is `subsidiary-coding-system'.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1872 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1873 (coding_system))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1874 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1875 Lisp_Object base;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1876

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1877 coding_system = Fget_coding_system (coding_system);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1878 if (EQ (XCODING_SYSTEM_NAME (coding_system), Qbinary))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1879 return Fget_coding_system (Qraw_text); /* hack! */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1880 base = XCODING_SYSTEM_SUBSIDIARY_PARENT (coding_system);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1881 if (!NILP (base))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1882 return base;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1883 return coding_system;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1884 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1885

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1886 DEFUN ("coding-system-used-for-io", Fcoding_system_used_for_io,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1887 1, 1, 0, /*

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1888 Return the coding system actually used for I/O.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1889 In some cases (e.g. when a particular EOL type is specified) this won't be

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1890 the coding system itself. This can be useful when trying to track down

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1891 more closely how exactly data is decoded.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1892 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1893 (coding_system))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1894 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1895 Lisp_Object canon;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1896

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1897 coding_system = Fget_coding_system (coding_system);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1898 canon = XCODING_SYSTEM_CANONICAL (coding_system);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1899 if (!NILP (canon))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1900 return canon;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1901 return coding_system;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1902 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1903

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1904

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1905 /************************************************************************/

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1906 /* Coding system accessors */

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1907 /************************************************************************/

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1908

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1909 DEFUN ("coding-system-description", Fcoding_system_description, 1, 1, 0, /*

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1910 Return the description for CODING-SYSTEM.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1911 The `description' of a coding system is a short English phrase giving the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1912 name rendered according to English punctuation rules, plus possibly some

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1913 explanatory text (typically in the form of a parenthetical phrase). The

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1914 description is intended to be short enough that it can appear as a menu item,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1915 and clear enough to be recognizable even to someone who is assumed to have

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1916 some basic familiarity with different encodings but may not know all the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1917 technical names; thus, for `cn-gb-2312' is described as "Chinese EUC" and

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1918 `hz-gb-2312' is described as "Hz/ZW (Chinese)", where the actual name of

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1919 the encoding is given, followed by a note that this is a Chinese encoding,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1920 because the great majority of people encountering this would have no idea

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1921 what it is, and giving the language indicates whether the encoding should

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1922 just be ignored or (conceivably) investigated more thoroughly.

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1923 */

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1924 (coding_system))

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1925 {

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1926 coding_system = Fget_coding_system (coding_system);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1927 return XCODING_SYSTEM_DESCRIPTION (coding_system);

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1928 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1929

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1930 DEFUN ("coding-system-type", Fcoding_system_type, 1, 1, 0, /*

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1931 Return the type of CODING-SYSTEM.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1932 */

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1933 (coding_system))

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1934 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1935 coding_system = Fget_coding_system (coding_system);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1936 return XCODING_SYSTEM_TYPE (coding_system);

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1937 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1938

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1939 DEFUN ("coding-system-property", Fcoding_system_property, 2, 2, 0, /*

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1940 Return the PROP property of CODING-SYSTEM.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1941 */

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1942 (coding_system, prop))

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1943 {

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1944 coding_system = Fget_coding_system (coding_system);

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1945 CHECK_SYMBOL (prop);

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1946

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1947 if (EQ (prop, Qname))

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1948 return XCODING_SYSTEM_NAME (coding_system);

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1949 else if (EQ (prop, Qtype))

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1950 return Fcoding_system_type (coding_system);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1951 else if (EQ (prop, Qdescription))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1952 return XCODING_SYSTEM_DESCRIPTION (coding_system);

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1953 else if (EQ (prop, Qmnemonic))

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1954 return XCODING_SYSTEM_MNEMONIC (coding_system);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1955 else if (EQ (prop, Qdocumentation))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1956 return XCODING_SYSTEM_DOCUMENTATION (coding_system);

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1957 else if (EQ (prop, Qeol_type))

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1958 return eol_type_to_symbol (XCODING_SYSTEM_EOL_TYPE

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1959 (coding_system));

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1960 else if (EQ (prop, Qeol_lf))

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1961 return XCODING_SYSTEM_EOL_LF (coding_system);

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1962 else if (EQ (prop, Qeol_crlf))

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1963 return XCODING_SYSTEM_EOL_CRLF (coding_system);

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1964 else if (EQ (prop, Qeol_cr))

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1965 return XCODING_SYSTEM_EOL_CR (coding_system);

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1966 else if (EQ (prop, Qpost_read_conversion))

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1967 return XCODING_SYSTEM_POST_READ_CONVERSION (coding_system);

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1968 else if (EQ (prop, Qpre_write_conversion))

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

1969 return XCODING_SYSTEM_PRE_WRITE_CONVERSION (coding_system);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1970 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1971 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1972 Lisp_Object value = CODESYSMETH_OR_GIVEN (XCODING_SYSTEM (coding_system),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1973 getprop,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1974 (coding_system, prop),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1975 Qunbound);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1976 if (UNBOUNDP (value))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1977 invalid_constant ("Unrecognized property", prop);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1978 return value;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1979 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1980 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1981

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1982

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1983 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1984 /* Coding stream functions */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1985 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1986

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1987 /* A coding stream is a stream used for encoding or decoding text. The

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1988 coding-stream object keeps track of the actual coding system, the stream

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1989 that is at the other end, and data that needs to be persistent across

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1990 the lifetime of the stream. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1991

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1992 DEFINE_LSTREAM_IMPLEMENTATION ("coding", coding);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1993

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1994 /* Encoding and decoding are parallel operations, so we create just one

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1995 stream for both. "Decoding" may involve the extra step of autodetection

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1996 of the data format, but that's only because of the conventional

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1997 definition of decoding as converting from external- to

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1998 internal-formatted data.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

1999

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2000 #### We really need to abstract out the concept of "data formats" and

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2001 define "converters" that convert from and to specified formats,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2002 eliminating the idea of decoding and encoding. When specifying a

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2003 conversion process, we need to give the data formats themselves, not the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2004 conversion processes -- e.g. a coding system called "Unicode->multibyte"

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2005 converts in both directions, and we could auto-detect the format of data

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2006 at either end. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2007

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2008 static Bytecount

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2009 coding_reader (Lstream *stream, unsigned char *data, Bytecount size)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2010 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2011 unsigned char *orig_data = data;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2012 Bytecount read_size;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2013 int error_occurred = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2014 struct coding_stream *str = CODING_STREAM_DATA (stream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2015

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2016 /* We need to interface to coding_{de,en}code_1(), which expects to take

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2017 some amount of data and store the result into a Dynarr. We have

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2018 coding_{de,en}code_1() store into c->runoff, and take data from there

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2019 as necessary. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2020

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2021 /* We loop until we have enough data, reading chunks from the other

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2022 end and converting it. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2023 while (1)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2024 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2025 /* Take data from convert_to if we can. Make sure to take at

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2026 most SIZE bytes, and delete the data from convert_to. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2027 if (Dynarr_length (str->convert_to) > 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2028 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2029 Bytecount chunk =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2030 min (size, (Bytecount) Dynarr_length (str->convert_to));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2031 memcpy (data, Dynarr_atp (str->convert_to, 0), chunk);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2032 Dynarr_delete_many (str->convert_to, 0, chunk);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2033 data += chunk;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2034 size -= chunk;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2035 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2036

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2037 if (size == 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2038 break; /* No more room for data */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2039

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2040 if (str->eof)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2041 break;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2042

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2043 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2044 /* Exhausted convert_to, so get some more. Read into convert_from,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2045 after existing "rejected" data from the last conversion. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2046 Bytecount rejected = Dynarr_length (str->convert_from);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2047 /* #### 1024 is arbitrary; we really need to separate 0 from EOF,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2048 and when we get 0, keep taking more data until we don't get 0 --

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2049 we don't know how much data the conversion routine might need

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2050 before it can generate any data of its own */

814

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2051 Bytecount readmore =

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2052 str->one_byte_at_a_time ? (Bytecount) 1 :

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2053 max (size, (Bytecount) 1024);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2054

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2055 Dynarr_add_many (str->convert_from, 0, readmore);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2056 read_size = Lstream_read (str->other_end,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2057 Dynarr_atp (str->convert_from, rejected),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2058 readmore);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2059 /* Trim size down to how much we actually got */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2060 Dynarr_set_size (str->convert_from, rejected + max (0, read_size));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2061 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2062

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2063 if (read_size < 0) /* LSTREAM_ERROR */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2064 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2065 error_occurred = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2066 break;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2067 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2068 if (read_size == 0) /* LSTREAM_EOF */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2069 /* There might be some more end data produced in the translation,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2070 so we set a flag and call the conversion method once more to

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2071 output any final stuff it may be holding, any "go back to a sane

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2072 state" escape sequences, etc. The conversion method is free to

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2073 look at this flag, and we use it above to stop looping. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2074 str->eof = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2075 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2076 Bytecount processed;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2077 Bytecount to_process = Dynarr_length (str->convert_from);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2078

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2079 /* Convert the data, and save any rejected data in convert_from */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2080 processed =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2081 XCODESYSMETH (str->codesys, convert,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2082 (str, Dynarr_atp (str->convert_from, 0),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2083 str->convert_to, to_process));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2084 if (processed < 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2085 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2086 error_occurred = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2087 break;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2088 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2089 assert (processed <= to_process);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2090 if (processed < to_process)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2091 memmove (Dynarr_atp (str->convert_from, 0),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2092 Dynarr_atp (str->convert_from, processed),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2093 to_process - processed);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2094 Dynarr_set_size (str->convert_from, to_process - processed);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2095 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2096 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2097

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2098 if (data - orig_data == 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2099 return error_occurred ? -1 : 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2100 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2101 return data - orig_data;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2102 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2103

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2104 static Bytecount

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2105 coding_writer (Lstream *stream, const unsigned char *data, Bytecount size)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2106 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2107 struct coding_stream *str = CODING_STREAM_DATA (stream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2108

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2109 /* Convert all our data into convert_to, and then attempt to write

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2110 it all out to the other end. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2111 Dynarr_reset (str->convert_to);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2112 size = XCODESYSMETH (str->codesys, convert,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2113 (str, data, str->convert_to, size));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2114 if (Lstream_write (str->other_end, Dynarr_atp (str->convert_to, 0),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2115 Dynarr_length (str->convert_to)) < 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2116 return -1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2117 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2118 /* The return value indicates how much of the incoming data was

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2119 processed, not how many bytes were written. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2120 return size;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2121 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2122

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2123 static int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2124 encode_decode_source_sink_type_is_char (Lisp_Object cs,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2125 enum source_or_sink sex,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2126 enum encode_decode direction)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2127 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2128 return (direction == CODING_DECODE ?

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2129 decoding_source_sink_type_is_char (cs, sex) :

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2130 encoding_source_sink_type_is_char (cs, sex));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2131 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2132

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2133 /* Ensure that the convert methods only get full characters sent to them to

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2134 convert if the source of that conversion is characters; and that no such

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2135 full-character checking happens when the source is bytes. Keep in mind

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2136 that (1) the conversion_end_type return values take the perspective of

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2137 encoding; (2) the source for decoding is the same as the sink for

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2138 encoding; (3) when writing, the data is given to us, and we set our own

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2139 stream to be character mode or not; (4) when reading, the data comes

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2140 from the other_end stream, and we set that one to be character mode or

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2141 not. This is consistent with the comment above the prototype for

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2142 Lstream_set_character_mode(), which lays out rules for who is allowed to

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2143 modify the character type mode on a stream.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2144

814

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2145 If we're a read stream, we're always setting character mode on the

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2146 source, but we also set it on ourselves consistent with the flag that

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2147 can disable this (see again the comment above

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2148 Lstream_set_character_mode()).

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2149 */

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2150

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2151 static void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2152 set_coding_character_mode (Lstream *stream)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2153 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2154 struct coding_stream *str = CODING_STREAM_DATA (stream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2155 Lstream *stream_to_set =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2156 stream->flags & LSTREAM_FL_WRITE ? stream : str->other_end;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2157 if (encode_decode_source_sink_type_is_char

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2158 (str->codesys, CODING_SOURCE, str->direction))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2159 Lstream_set_character_mode (stream_to_set);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2160 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2161 Lstream_unset_character_mode (stream_to_set);

814

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2162 if (str->set_char_mode_on_us_when_reading &&

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2163 (stream->flags & LSTREAM_FL_READ))

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2164 {

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2165 if (encode_decode_source_sink_type_is_char

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2166 (str->codesys, CODING_SINK, str->direction))

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2167 Lstream_set_character_mode (stream);

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2168 else

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2169 Lstream_unset_character_mode (stream);

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2170 }

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2171 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2172

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2173 static Lisp_Object

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2174 coding_marker (Lisp_Object stream)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2175 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2176 struct coding_stream *str = CODING_STREAM_DATA (XLSTREAM (stream));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2177

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2178 mark_object (str->orig_codesys);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2179 mark_object (str->codesys);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2180 MAYBE_XCODESYSMETH (str->codesys, mark_coding_stream, (str));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2181 return wrap_lstream (str->other_end);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2182 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2183

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2184 static int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2185 coding_rewinder (Lstream *stream)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2186 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2187 struct coding_stream *str = CODING_STREAM_DATA (stream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2188 MAYBE_XCODESYSMETH (str->codesys, rewind_coding_stream, (str));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2189

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2190 str->ch = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2191 Dynarr_reset (str->convert_to);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2192 Dynarr_reset (str->convert_from);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2193 return Lstream_rewind (str->other_end);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2194 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2195

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2196 static int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2197 coding_seekable_p (Lstream *stream)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2198 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2199 struct coding_stream *str = CODING_STREAM_DATA (stream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2200 return Lstream_seekable_p (str->other_end);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2201 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2202

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2203 static int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2204 coding_flusher (Lstream *stream)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2205 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2206 struct coding_stream *str = CODING_STREAM_DATA (stream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2207 return Lstream_flush (str->other_end);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2208 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2209

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2210 static int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2211 coding_closer (Lstream *stream)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2212 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2213 struct coding_stream *str = CODING_STREAM_DATA (stream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2214 if (stream->flags & LSTREAM_FL_WRITE)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2215 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2216 str->eof = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2217 coding_writer (stream, 0, 0);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2218 str->eof = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2219 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2220 /* It's safe to free the runoff dynarrs now because they are used only

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2221 during conversion. We need to keep the type-specific data around,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2222 though, because of canonicalize_after_coding. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2223 if (str->convert_to)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2224 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2225 Dynarr_free (str->convert_to);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2226 str->convert_to = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2227 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2228 if (str->convert_from)

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

2229 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2230 Dynarr_free (str->convert_from);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2231 str->convert_from = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2232 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2233

800

a5954632b187 [xemacs-hg @ 2002-03-31 08:27:14 by ben]

ben

parents: 793

diff changeset

2234 if (str->no_close_other)

a5954632b187 [xemacs-hg @ 2002-03-31 08:27:14 by ben]

ben

parents: 793

diff changeset

2235 return Lstream_flush (str->other_end);

a5954632b187 [xemacs-hg @ 2002-03-31 08:27:14 by ben]

ben

parents: 793

diff changeset

2236 else

a5954632b187 [xemacs-hg @ 2002-03-31 08:27:14 by ben]

ben

parents: 793

diff changeset

2237 return Lstream_close (str->other_end);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2238 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2239

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2240 static void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2241 coding_finalizer (Lstream *stream)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2242 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2243 struct coding_stream *str = CODING_STREAM_DATA (stream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2244

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2245 assert (!str->finalized);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2246 MAYBE_XCODESYSMETH (str->codesys, finalize_coding_stream, (str));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2247 if (str->data)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2248 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2249 xfree (str->data);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2250 str->data = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2251 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2252 str->finalized = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2253 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2254

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2255 static Lisp_Object

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2256 coding_stream_canonicalize_after_coding (Lstream *stream)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2257 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2258 struct coding_stream *str = CODING_STREAM_DATA (stream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2259

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2260 return XCODESYSMETH_OR_GIVEN (str->codesys, canonicalize_after_coding,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2261 (str), str->codesys);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2262 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2263

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2264 Lisp_Object

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2265 coding_stream_detected_coding_system (Lstream *stream)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2266 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2267 Lisp_Object codesys =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2268 coding_stream_canonicalize_after_coding (stream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2269 if (NILP (codesys))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2270 return Fget_coding_system (Qidentity);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2271 return codesys;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2272 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2273

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2274 Lisp_Object

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2275 coding_stream_coding_system (Lstream *stream)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2276 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2277 return CODING_STREAM_DATA (stream)->codesys;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2278 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2279

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2280 /* Change the coding system associated with a stream. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2281

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2282 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2283 set_coding_stream_coding_system (Lstream *lstr, Lisp_Object codesys)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2284 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2285 struct coding_stream *str = CODING_STREAM_DATA (lstr);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2286 if (EQ (str->orig_codesys, codesys))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2287 return;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2288 /* We do the equivalent of closing the stream, destroying it, and

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2289 reinitializing it. This includes flushing out the data and signalling

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2290 EOF, if we're a writing stream; we also replace the type-specific data

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2291 with the data appropriate for the new coding system. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2292 if (!NILP (str->codesys))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2293 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2294 if (lstr->flags & LSTREAM_FL_WRITE)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2295 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2296 Lstream_flush (lstr);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2297 str->eof = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2298 coding_writer (lstr, 0, 0);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2299 str->eof = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2300 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2301 MAYBE_XCODESYSMETH (str->codesys, finalize_coding_stream, (str));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2302 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2303 str->orig_codesys = codesys;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2304 str->codesys = coding_system_real_canonical (codesys);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2305

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2306 if (str->data)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2307 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2308 xfree (str->data);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2309 str->data = 0;

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

2310 }

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2311 if (XCODING_SYSTEM_METHODS (str->codesys)->coding_data_size)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2312 str->data =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2313 xmalloc_and_zero (XCODING_SYSTEM_METHODS (str->codesys)->

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2314 coding_data_size);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2315 MAYBE_XCODESYSMETH (str->codesys, init_coding_stream, (str));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2316 /* The new coding system may have different ideas regarding whether its

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2317 ends are characters or bytes. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2318 set_coding_character_mode (lstr);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2319 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2320

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2321 /* WARNING WARNING WARNING WARNING!!!!! If you open up a coding

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2322 stream for writing, no automatic code detection will be performed.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2323 The reason for this is that automatic code detection requires a

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2324 seekable input. Things will also fail if you open a coding

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2325 stream for reading using a non-fully-specified coding system and

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2326 a non-seekable input stream. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2327

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2328 static Lisp_Object

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2329 make_coding_stream_1 (Lstream *stream, Lisp_Object codesys,

800

a5954632b187 [xemacs-hg @ 2002-03-31 08:27:14 by ben]

ben

parents: 793

diff changeset

2330 const char *mode, enum encode_decode direction,

802

19dfb459d51a [xemacs-hg @ 2002-04-03 10:47:37 by ben]

ben

parents: 801

diff changeset

2331 int flags)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2332 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2333 Lstream *lstr = Lstream_new (lstream_coding, mode);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2334 struct coding_stream *str = CODING_STREAM_DATA (lstr);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2335

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2336 codesys = Fget_coding_system (codesys);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2337 xzero (*str);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2338 str->codesys = Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2339 str->orig_codesys = Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2340 str->us = lstr;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2341 str->other_end = stream;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2342 str->convert_to = Dynarr_new (unsigned_char);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2343 str->convert_from = Dynarr_new (unsigned_char);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2344 str->direction = direction;

814

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2345 if (flags & LSTREAM_FL_NO_CLOSE_OTHER)

802

19dfb459d51a [xemacs-hg @ 2002-04-03 10:47:37 by ben]

ben

parents: 801

diff changeset

2346 str->no_close_other = 1;

814

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2347 if (flags & LSTREAM_FL_READ_ONE_BYTE_AT_A_TIME)

802

19dfb459d51a [xemacs-hg @ 2002-04-03 10:47:37 by ben]

ben

parents: 801

diff changeset

2348 str->one_byte_at_a_time = 1;

814

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2349 if (!(flags & LSTREAM_FL_NO_INIT_CHAR_MODE_WHEN_READING))

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2350 str->set_char_mode_on_us_when_reading = 1;

802

19dfb459d51a [xemacs-hg @ 2002-04-03 10:47:37 by ben]

ben

parents: 801

diff changeset

2351

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2352 set_coding_stream_coding_system (lstr, codesys);

793

e38acbeb1cae [xemacs-hg @ 2002-03-29 04:46:17 by ben]

ben

parents: 778

diff changeset

2353 return wrap_lstream (lstr);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2354 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2355

814

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2356 /* FLAGS:

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2357

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2358 LSTREAM_FL_NO_CLOSE_OTHER

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2359 Don't close STREAM (the stream at the other end) when this stream is

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2360 closed.

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2361

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2362 LSTREAM_FL_READ_ONE_BYTE_AT_A_TIME

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2363 When reading from STREAM, read and process one byte at a time rather

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2364 than in large chunks. This is for reading from TTY's, so we don't

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2365 block. #### We should instead create a non-blocking filedesc stream

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2366 that emulates the behavior as necessary using select(), when the

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2367 fcntls don't work. (As seems to be the case on Cygwin.)

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2368

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2369 LSTREAM_FL_NO_INIT_CHAR_MODE_WHEN_READING

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2370 When reading from STREAM, read and process one byte at a time rather

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2371 than in large chunks. This is for reading from TTY's, so we don't

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2372 block. #### We should instead create a non-blocking filedesc stream

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2373 that emulates the behavior as necessary using select(), when the

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2374 fcntls don't work. (As seems to be the case on Cygwin.)

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2375 */

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2376 Lisp_Object

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2377 make_coding_input_stream (Lstream *stream, Lisp_Object codesys,

802

19dfb459d51a [xemacs-hg @ 2002-04-03 10:47:37 by ben]

ben

parents: 801

diff changeset

2378 enum encode_decode direction, int flags)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2379 {

800

a5954632b187 [xemacs-hg @ 2002-03-31 08:27:14 by ben]

ben

parents: 793

diff changeset

2380 return make_coding_stream_1 (stream, codesys, "r", direction,

802

19dfb459d51a [xemacs-hg @ 2002-04-03 10:47:37 by ben]

ben

parents: 801

diff changeset

2381 flags);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2382 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2383

814

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2384 /* FLAGS:

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2385

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2386 LSTREAM_FL_NO_CLOSE_OTHER

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2387 Don't close STREAM (the stream at the other end) when this stream is

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2388 closed.

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

2389 */

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2390 Lisp_Object

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2391 make_coding_output_stream (Lstream *stream, Lisp_Object codesys,

802

19dfb459d51a [xemacs-hg @ 2002-04-03 10:47:37 by ben]

ben

parents: 801

diff changeset

2392 enum encode_decode direction, int flags)

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2393 {

800

a5954632b187 [xemacs-hg @ 2002-03-31 08:27:14 by ben]

ben

parents: 793

diff changeset

2394 return make_coding_stream_1 (stream, codesys, "w", direction,

802

19dfb459d51a [xemacs-hg @ 2002-04-03 10:47:37 by ben]

ben

parents: 801

diff changeset

2395 flags);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2396 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2397

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2398 static Lisp_Object

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2399 encode_decode_coding_region (Lisp_Object start, Lisp_Object end,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2400 Lisp_Object coding_system, Lisp_Object buffer,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2401 enum encode_decode direction)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2402 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2403 Charbpos b, e;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2404 struct buffer *buf = decode_buffer (buffer, 0);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2405 Lisp_Object instream = Qnil, to_outstream = Qnil, outstream = Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2406 Lisp_Object from_outstream = Qnil, auto_outstream = Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2407 Lisp_Object lb_outstream = Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2408 Lisp_Object next;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2409 Lstream *istr, *ostr;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2410 struct gcpro gcpro1, gcpro2, gcpro3, gcpro4, gcpro5;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2411 struct gcpro ngcpro1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2412 int source_char, sink_char;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2413

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2414 get_buffer_range_char (buf, start, end, &b, &e, 0);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2415 barf_if_buffer_read_only (buf, b, e);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2416

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2417 GCPRO5 (instream, to_outstream, outstream, from_outstream, lb_outstream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2418 NGCPRO1 (auto_outstream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2419

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2420 coding_system = Fget_coding_system (coding_system);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2421 source_char = encode_decode_source_sink_type_is_char (coding_system,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2422 CODING_SOURCE,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2423 direction);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2424 sink_char = encode_decode_source_sink_type_is_char (coding_system,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2425 CODING_SINK,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2426 direction);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2427

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2428 /* Order is IN <---> [TO] -> OUT -> [FROM] -> [AUTODETECT-EOL] -> LB */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2429 instream = make_lisp_buffer_input_stream (buf, b, e, 0);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2430 next = lb_outstream = make_lisp_buffer_output_stream (buf, b, 0);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2431

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2432 if (direction == CODING_DECODE &&

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2433 XCODING_SYSTEM_EOL_TYPE (coding_system) == EOL_AUTODETECT)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2434 next = auto_outstream =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2435 make_coding_output_stream

800

a5954632b187 [xemacs-hg @ 2002-03-31 08:27:14 by ben]

ben

parents: 793

diff changeset

2436 (XLSTREAM (next), Fget_coding_system (Qconvert_eol_autodetect),

a5954632b187 [xemacs-hg @ 2002-03-31 08:27:14 by ben]

ben

parents: 793

diff changeset

2437 CODING_DECODE, 0);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2438

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2439 if (!sink_char)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2440 next = from_outstream =

800

a5954632b187 [xemacs-hg @ 2002-03-31 08:27:14 by ben]

ben

parents: 793

diff changeset

2441 make_coding_output_stream (XLSTREAM (next), Qbinary, CODING_DECODE, 0);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2442 outstream = make_coding_output_stream (XLSTREAM (next), coding_system,

800

a5954632b187 [xemacs-hg @ 2002-03-31 08:27:14 by ben]

ben

parents: 793

diff changeset

2443 direction, 0);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2444 if (!source_char)

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

2445 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2446 to_outstream =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2447 make_coding_output_stream (XLSTREAM (outstream),

800

a5954632b187 [xemacs-hg @ 2002-03-31 08:27:14 by ben]

ben

parents: 793

diff changeset

2448 Qbinary, CODING_ENCODE, 0);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2449 ostr = XLSTREAM (to_outstream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2450 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2451 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2452 ostr = XLSTREAM (outstream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2453 istr = XLSTREAM (instream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2454

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2455 /* The chain of streams looks like this:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2456

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2457 [BUFFER] <----- send through

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2458 ------> [CHAR->BYTE i.e. ENCODE AS BINARY if source is

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2459 in bytes]

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2460 ------> [ENCODE/DECODE AS SPECIFIED]

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2461 ------> [BYTE->CHAR i.e. DECODE AS BINARY

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2462 if sink is in bytes]

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2463 ------> [AUTODETECT EOL if

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2464 we're decoding and

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2465 coding system calls

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2466 for this]

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2467 ------> [BUFFER]

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2468 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2469 while (1)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2470 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2471 char tempbuf[1024]; /* some random amount */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2472 Charbpos newpos, even_newer_pos;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2473 Charbpos oldpos = lisp_buffer_stream_startpos (istr);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2474 Bytecount size_in_bytes =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2475 Lstream_read (istr, tempbuf, sizeof (tempbuf));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2476

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2477 if (!size_in_bytes)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2478 break;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2479 newpos = lisp_buffer_stream_startpos (istr);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2480 Lstream_write (ostr, tempbuf, size_in_bytes);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2481 even_newer_pos = lisp_buffer_stream_startpos (istr);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2482 buffer_delete_range (buf, even_newer_pos - (newpos - oldpos),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2483 even_newer_pos, 0);

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

2484 }

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2485

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2486 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2487 Charcount retlen =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2488 lisp_buffer_stream_startpos (XLSTREAM (instream)) - b;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2489 Lstream_close (istr);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2490 Lstream_close (ostr);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2491 NUNGCPRO;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2492 UNGCPRO;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2493 Lstream_delete (istr);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2494 if (!NILP (from_outstream))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2495 Lstream_delete (XLSTREAM (from_outstream));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2496 Lstream_delete (XLSTREAM (outstream));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2497 if (!NILP (to_outstream))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2498 Lstream_delete (XLSTREAM (to_outstream));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2499 if (!NILP (auto_outstream))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2500 Lstream_delete (XLSTREAM (auto_outstream));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2501 Lstream_delete (XLSTREAM (lb_outstream));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2502 return make_int (retlen);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2503 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2504 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2505

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2506 DEFUN ("decode-coding-region", Fdecode_coding_region, 3, 4, 0, /*

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2507 Decode the text between START and END which is encoded in CODING-SYSTEM.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2508 This is useful if you've read in encoded text from a file without decoding

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2509 it (e.g. you read in a JIS-formatted file but used the `binary' or

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2510 `no-conversion' coding system, so that it shows up as "^[$B!<!+^[(B").

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2511 Return length of decoded text.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2512 BUFFER defaults to the current buffer if unspecified.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2513 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2514 (start, end, coding_system, buffer))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2515 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2516 return encode_decode_coding_region (start, end, coding_system, buffer,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2517 CODING_DECODE);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2518 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2519

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2520 DEFUN ("encode-coding-region", Fencode_coding_region, 3, 4, 0, /*

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2521 Encode the text between START and END using CODING-SYSTEM.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2522 This will, for example, convert Japanese characters into stuff such as

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2523 "^[$B!<!+^[(B" if you use the JIS encoding. Return length of encoded

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2524 text. BUFFER defaults to the current buffer if unspecified.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2525 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2526 (start, end, coding_system, buffer))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2527 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2528 return encode_decode_coding_region (start, end, coding_system, buffer,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2529 CODING_ENCODE);

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

2530 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

2531

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

2532

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

2533 /************************************************************************/

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2534 /* Chain methods */

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

2535 /************************************************************************/

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

2536

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2537 /* #### Need a way to create "opposite-direction" coding systems. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2538

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2539 /* Chain two or more coding systems together to make a combination coding

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2540 system. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2541 DEFINE_CODING_SYSTEM_TYPE (chain);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2542

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2543 struct chain_coding_system

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2544 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2545 /* List of coding systems, in decode order */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2546 Lisp_Object *chain;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2547 /* Number of coding systems in list */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2548 int count;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2549 /* Coding system to return as a result of canonicalize-after-coding */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2550 Lisp_Object canonicalize_after_coding;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2551 };

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2552

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2553 struct chain_coding_stream

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2554 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2555 int initted;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2556 /* Lstreams for chain coding system */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2557 Lisp_Object *lstreams;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2558 int lstream_count;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2559 };

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2560

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2561 static const struct lrecord_description lo_description_1[] = {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2562 { XD_LISP_OBJECT, 0 },

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2563 { XD_END }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2564 };

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2565

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2566 static const struct struct_description lo_description = {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2567 sizeof (Lisp_Object),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2568 lo_description_1

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2569 };

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2570

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2571 static const struct lrecord_description chain_coding_system_description[] = {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2572 { XD_INT,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2573 coding_system_data_offset + offsetof (struct chain_coding_system,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2574 count) },

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2575 { XD_STRUCT_PTR,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2576 coding_system_data_offset + offsetof (struct chain_coding_system,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2577 chain),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2578 XD_INDIRECT (0, 0), &lo_description },

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2579 { XD_LISP_OBJECT,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2580 coding_system_data_offset + offsetof (struct chain_coding_system,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2581 canonicalize_after_coding) },

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2582 { XD_END }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2583 };

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2584

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2585 static Lisp_Object

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2586 chain_canonicalize (Lisp_Object codesys)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2587 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2588 /* We make use of the fact that this method is called at init time, after

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2589 properties have been parsed. init_method is called too early. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2590 /* #### It's not clear we need this whole chain-canonicalize mechanism

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2591 any more. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2592 Lisp_Object chain = Flist (XCODING_SYSTEM_CHAIN_COUNT (codesys),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2593 XCODING_SYSTEM_CHAIN_CHAIN (codesys));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2594 chain = Fcons (XCODING_SYSTEM_PRE_WRITE_CONVERSION (codesys),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2595 Fcons (XCODING_SYSTEM_POST_READ_CONVERSION (codesys),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2596 chain));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2597 Fputhash (chain, codesys, Vchain_canonicalize_hash_table);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2598 return codesys;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2599 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2600

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2601 static Lisp_Object

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2602 chain_canonicalize_after_coding (struct coding_stream *str)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2603 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2604 Lisp_Object cac =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2605 XCODING_SYSTEM_CHAIN_CANONICALIZE_AFTER_CODING (str->codesys);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2606 if (!NILP (cac))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2607 return cac;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2608 return str->codesys;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2609 #if 0

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2610 struct chain_coding_stream *data = CODING_STREAM_TYPE_DATA (str, chain);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2611 Lisp_Object us = str->codesys, codesys;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2612 int i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2613 Lisp_Object chain;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2614 Lisp_Object tail;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2615 int changed = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2616

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2617 /* #### It's not clear we need this whole chain-canonicalize mechanism

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2618 any more. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2619 if (str->direction == CODING_ENCODE || !data->initted)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2620 return us;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2621

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2622 chain = Flist (XCODING_SYSTEM_CHAIN_COUNT (us),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2623 XCODING_SYSTEM_CHAIN_CHAIN (us));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2624

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2625 tail = chain;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2626 for (i = 0; i < XCODING_SYSTEM_CHAIN_COUNT (us); i++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2627 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2628 codesys = (coding_stream_canonicalize_after_coding

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2629 (XLSTREAM (data->lstreams[i])));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2630 if (!EQ (codesys, XCAR (tail)))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2631 changed = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2632 XCAR (tail) = codesys;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2633 tail = XCDR (tail);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2634 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2635

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2636 if (!changed)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2637 return us;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2638

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2639 chain = delq_no_quit (Qnil, chain);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2640

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2641 if (NILP (XCODING_SYSTEM_PRE_WRITE_CONVERSION (us)) &&

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2642 NILP (XCODING_SYSTEM_POST_READ_CONVERSION (us)))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2643 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2644 if (NILP (chain))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2645 return Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2646 if (NILP (XCDR (chain)))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2647 return XCAR (chain);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2648 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2649

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2650 codesys = Fgethash (Fcons (XCODING_SYSTEM_PRE_WRITE_CONVERSION (us),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2651 Fcons (XCODING_SYSTEM_POST_READ_CONVERSION (us),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2652 chain)), Vchain_canonicalize_hash_table,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2653 Qnil);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2654 if (!NILP (codesys))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2655 return codesys;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2656 return make_internal_coding_system

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2657 (us, "internal-chain-canonicalizer-wrapper",

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2658 Qchain, Qunbound, list2 (Qchain, chain));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2659 #endif /* 0 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2660 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2661

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2662 static void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2663 chain_init (Lisp_Object codesys)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2664 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2665 XCODING_SYSTEM_CHAIN_CANONICALIZE_AFTER_CODING (codesys) = Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2666 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2667

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2668 static void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2669 chain_mark (Lisp_Object codesys)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2670 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2671 int i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2672

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2673 for (i = 0; i < XCODING_SYSTEM_CHAIN_COUNT (codesys); i++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2674 mark_object (XCODING_SYSTEM_CHAIN_CHAIN (codesys)[i]);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2675 mark_object (XCODING_SYSTEM_CHAIN_CANONICALIZE_AFTER_CODING (codesys));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2676 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2677

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2678 static void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2679 chain_mark_coding_stream_1 (struct chain_coding_stream *data)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2680 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2681 int i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2682

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2683 for (i = 0; i < data->lstream_count; i++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2684 mark_object (data->lstreams[i]);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2685 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2686

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2687 static void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2688 chain_mark_coding_stream (struct coding_stream *str)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2689 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2690 chain_mark_coding_stream_1 (CODING_STREAM_TYPE_DATA (str, chain));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2691 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2692

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2693 static void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2694 chain_print (Lisp_Object cs, Lisp_Object printcharfun, int escapeflag)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2695 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2696 int i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2697

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2698 write_c_string (printcharfun, "(");

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2699 for (i = 0; i < XCODING_SYSTEM_CHAIN_COUNT (cs); i++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2700 {

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2701 write_c_string (printcharfun, i == 0 ? "" : "->");

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2702 print_coding_system_in_print_method (XCODING_SYSTEM_CHAIN_CHAIN (cs)[i],

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2703 printcharfun, escapeflag);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2704 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2705 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2706 Lisp_Object cac = XCODING_SYSTEM_CHAIN_CANONICALIZE_AFTER_CODING (cs);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2707 if (!NILP (cac))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2708 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2709 if (i > 0)

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2710 write_c_string (printcharfun, " ");

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2711 write_c_string (printcharfun, "canonicalize-after-coding=");

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2712 print_coding_system_in_print_method (cac, printcharfun, escapeflag);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2713 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2714 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2715

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2716 write_c_string (printcharfun, ")");

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2717 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2718

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2719 static void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2720 chain_rewind_coding_stream_1 (struct chain_coding_stream *data)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2721 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2722 /* Each will rewind the next; there is always at least one stream (the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2723 dynarr stream at the end) if we're initted */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2724 if (data->initted)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2725 Lstream_rewind (XLSTREAM (data->lstreams[0]));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2726 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2727

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2728 static void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2729 chain_rewind_coding_stream (struct coding_stream *str)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2730 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2731 chain_rewind_coding_stream_1 (CODING_STREAM_TYPE_DATA (str, chain));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2732 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2733

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2734 static void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2735 chain_init_coding_streams_1 (struct chain_coding_stream *data,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2736 unsigned_char_dynarr *dst,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2737 int ncodesys, Lisp_Object *codesys,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2738 enum encode_decode direction)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2739 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2740 int i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2741 Lisp_Object lstream_out;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2742

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2743 data->lstream_count = ncodesys + 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2744 data->lstreams = xnew_array (Lisp_Object, data->lstream_count);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2745

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2746 lstream_out = make_dynarr_output_stream (dst);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2747 Lstream_set_buffering (XLSTREAM (lstream_out), LSTREAM_UNBUFFERED, 0);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2748 data->lstreams[data->lstream_count - 1] = lstream_out;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2749

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2750 for (i = ncodesys - 1; i >= 0; i--)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2751 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2752 data->lstreams[i] =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2753 make_coding_output_stream

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2754 (XLSTREAM (lstream_out),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2755 codesys[direction == CODING_ENCODE ? ncodesys - (i + 1) : i],

800

a5954632b187 [xemacs-hg @ 2002-03-31 08:27:14 by ben]

ben

parents: 793

diff changeset

2756 direction, 0);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2757 lstream_out = data->lstreams[i];

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2758 Lstream_set_buffering (XLSTREAM (lstream_out), LSTREAM_UNBUFFERED,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2759 0);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2760 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2761 data->initted = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2762 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2763

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2764 static Bytecount

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2765 chain_convert (struct coding_stream *str, const UExtbyte *src,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2766 unsigned_char_dynarr *dst, Bytecount n)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2767 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2768 struct chain_coding_stream *data = CODING_STREAM_TYPE_DATA (str, chain);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2769

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2770 if (str->eof)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2771 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2772 /* Each will close the next; there is always at least one stream (the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2773 dynarr stream at the end) if we're initted. We need to close now

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2774 because more data may be generated. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2775 if (data->initted)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2776 Lstream_close (XLSTREAM (data->lstreams[0]));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2777 return n;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2778 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2779

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2780 if (!data->initted)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2781 chain_init_coding_streams_1

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2782 (data, dst, XCODING_SYSTEM_CHAIN_COUNT (str->codesys),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2783 XCODING_SYSTEM_CHAIN_CHAIN (str->codesys), str->direction);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2784

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2785 if (Lstream_write (XLSTREAM (data->lstreams[0]), src, n) < 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2786 return -1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2787 return n;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2788 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2789

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2790 static void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2791 chain_finalize_coding_stream_1 (struct chain_coding_stream *data)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2792 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2793 if (data->lstreams)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2794 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2795 /* Order of deletion is important here! Delete from the head of the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2796 chain and work your way towards the tail. In general, when you

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2797 delete an object, there should be *NO* pointers to it anywhere.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2798 Deleting back-to-front would be a problem because there are

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2799 pointers going forward. If there were pointers in both

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2800 directions, you'd have to disconnect the pointers to a particular

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2801 object before deleting it. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2802 if (!gc_in_progress)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2803 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2804 int i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2805 /* During GC, these objects are unmarked, and are about to be

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2806 freed. We do NOT want them on the free list, and that will

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2807 cause lots of nastiness including crashes. Just let them be

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2808 freed normally. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2809 for (i = 0; i < data->lstream_count; i++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2810 Lstream_delete (XLSTREAM ((data->lstreams)[i]));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2811 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2812 xfree (data->lstreams);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2813 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2814 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2815

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2816 static void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2817 chain_finalize_coding_stream (struct coding_stream *str)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2818 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2819 chain_finalize_coding_stream_1 (CODING_STREAM_TYPE_DATA (str, chain));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2820 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2821

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2822 static void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2823 chain_finalize (Lisp_Object c)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2824 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2825 if (XCODING_SYSTEM_CHAIN_CHAIN (c))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2826 xfree (XCODING_SYSTEM_CHAIN_CHAIN (c));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2827 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2828

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

2829 static int

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2830 chain_putprop (Lisp_Object codesys, Lisp_Object key, Lisp_Object value)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2831 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2832 if (EQ (key, Qchain))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2833 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2834 Lisp_Object tail;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2835 Lisp_Object *cslist;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2836 int count = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2837 int i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2838

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2839 EXTERNAL_LIST_LOOP (tail, value)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2840 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2841 Fget_coding_system (XCAR (tail));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2842 count++;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2843 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2844

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2845 cslist = xnew_array (Lisp_Object, count);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2846 XCODING_SYSTEM_CHAIN_CHAIN (codesys) = cslist;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2847

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2848 count = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2849 EXTERNAL_LIST_LOOP (tail, value)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2850 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2851 cslist[count] = Fget_coding_system (XCAR (tail));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2852 count++;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2853 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2854

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2855 XCODING_SYSTEM_CHAIN_COUNT (codesys) = count;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2856

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2857 for (i = 0; i < count - 1; i++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2858 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2859 if (decoding_source_sink_type_is_char (cslist[i], CODING_SINK) !=

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2860 decoding_source_sink_type_is_char (cslist[i + 1], CODING_SOURCE))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2861 invalid_argument_2 ("Sink of first must match source of second",

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2862 cslist[i], cslist[i + 1]);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2863 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2864 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2865 else if (EQ (key, Qcanonicalize_after_coding))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2866 XCODING_SYSTEM_CHAIN_CANONICALIZE_AFTER_CODING (codesys) =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2867 Fget_coding_system (value);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2868 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2869 return 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2870 return 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2871 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2872

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2873 static Lisp_Object

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2874 chain_getprop (Lisp_Object coding_system, Lisp_Object prop)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2875 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2876 if (EQ (prop, Qchain))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2877 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2878 Lisp_Object result = Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2879 int i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2880

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2881 for (i = 0; i < XCODING_SYSTEM_CHAIN_COUNT (coding_system); i++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2882 result = Fcons (XCODING_SYSTEM_CHAIN_CHAIN (coding_system)[i],

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2883 result);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2884

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2885 return Fnreverse (result);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2886 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2887 else if (EQ (prop, Qcanonicalize_after_coding))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2888 return XCODING_SYSTEM_CHAIN_CANONICALIZE_AFTER_CODING (coding_system);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2889 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2890 return Qunbound;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2891 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2892

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2893 static enum source_sink_type

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2894 chain_conversion_end_type (Lisp_Object codesys)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2895 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2896 Lisp_Object *cslist = XCODING_SYSTEM_CHAIN_CHAIN (codesys);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2897 int n = XCODING_SYSTEM_CHAIN_COUNT (codesys);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2898 int charp_source, charp_sink;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2899

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2900 if (n == 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2901 return DECODES_BYTE_TO_BYTE; /* arbitrary */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2902 charp_source = decoding_source_sink_type_is_char (cslist[0], CODING_SOURCE);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2903 charp_sink = decoding_source_sink_type_is_char (cslist[n - 1], CODING_SINK);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2904

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2905 switch (charp_source * 2 + charp_sink)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2906 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2907 case 0: return DECODES_BYTE_TO_BYTE;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2908 case 1: return DECODES_BYTE_TO_CHARACTER;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2909 case 2: return DECODES_CHARACTER_TO_BYTE;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2910 case 3: return DECODES_CHARACTER_TO_CHARACTER;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2911 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2912

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2913 abort ();

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2914 return DECODES_BYTE_TO_BYTE;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2915 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2916

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2917

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2918 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2919 /* No-conversion methods */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2920 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2921

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2922 /* "No conversion"; used for binary files. We use quotes because there

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2923 really is some conversion being applied (it does byte<->char

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2924 conversion), but it appears to the user as if the text is read in

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2925 without conversion. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2926 DEFINE_CODING_SYSTEM_TYPE (no_conversion);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2927

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2928 /* This is used when reading in "binary" files -- i.e. files that may

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2929 contain all 256 possible byte values and that are not to be

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2930 interpreted as being in any particular encoding. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2931 static Bytecount

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2932 no_conversion_convert (struct coding_stream *str,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2933 const UExtbyte *src,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2934 unsigned_char_dynarr *dst, Bytecount n)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2935 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2936 UExtbyte c;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2937 unsigned int ch = str->ch;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2938 Bytecount orign = n;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2939

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2940 if (str->direction == CODING_DECODE)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2941 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2942 while (n--)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2943 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2944 c = *src++;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2945

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2946 DECODE_ADD_BINARY_CHAR (c, dst);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2947 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2948

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2949 if (str->eof)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2950 DECODE_OUTPUT_PARTIAL_CHAR (ch, dst);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2951 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2952 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2953 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2954

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2955 while (n--)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2956 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2957 c = *src++;

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

2958 if (byte_ascii_p (c))

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2959 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2960 assert (ch == 0);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2961 Dynarr_add (dst, c);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2962 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2963 #ifdef MULE

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 851

diff changeset

2964 else if (ibyte_leading_byte_p (c))

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2965 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2966 assert (ch == 0);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2967 if (c == LEADING_BYTE_LATIN_ISO8859_1 ||

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2968 c == LEADING_BYTE_CONTROL_1)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2969 ch = c;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2970 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2971 Dynarr_add (dst, '~'); /* untranslatable character */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2972 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2973 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2974 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2975 if (ch == LEADING_BYTE_LATIN_ISO8859_1)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2976 Dynarr_add (dst, c);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2977 else if (ch == LEADING_BYTE_CONTROL_1)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2978 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2979 assert (c < 0xC0);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2980 Dynarr_add (dst, c - 0x20);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2981 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2982 /* else it should be the second or third byte of an

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2983 untranslatable character, so ignore it */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2984 ch = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2985 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2986 #endif /* MULE */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2987

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2988 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2989 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2990

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2991 str->ch = ch;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2992 return orign;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2993 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2994

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2995 DEFINE_DETECTOR (no_conversion);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2996 DEFINE_DETECTOR_CATEGORY (no_conversion, no_conversion);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2997

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2998 struct no_conversion_detector

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

2999 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3000 int dummy;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3001 };

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3002

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3003 static void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3004 no_conversion_detect (struct detection_state *st, const UExtbyte *src,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3005 Bytecount n)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3006 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3007 /* Hack until we get better handling of this stuff! */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3008 DET_RESULT (st, no_conversion) = DET_SLIGHTLY_LIKELY;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3009 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3010

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3011

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3012 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3013 /* Convert-eol methods */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3014 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3015

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3016 /* This is used to handle end-of-line (EOL) differences. It is

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3017 character-to-character, and works (when encoding) *BEFORE* sending

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3018 data to the main encoding routine -- thus, that routine must handle

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3019 different EOL types itself if it does line-oriented type processing.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3020 This is unavoidable because we don't know whether the output of the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3021 main encoding routine is ASCII compatible (Unicode is definitely not,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3022 for example).

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3023

793

e38acbeb1cae [xemacs-hg @ 2002-03-29 04:46:17 by ben]

ben

parents: 778

diff changeset

3024 There is one parameter: `subtype', either `cr', `lf', `crlf', or nil.

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3025 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3026

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3027 DEFINE_CODING_SYSTEM_TYPE (convert_eol);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3028

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3029 struct convert_eol_coding_system

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3030 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3031 enum eol_type subtype;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3032 };

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3033

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3034 #define CODING_SYSTEM_CONVERT_EOL_SUBTYPE(codesys) \

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3035 (CODING_SYSTEM_TYPE_DATA (codesys, convert_eol)->subtype)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3036 #define XCODING_SYSTEM_CONVERT_EOL_SUBTYPE(codesys) \

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3037 (XCODING_SYSTEM_TYPE_DATA (codesys, convert_eol)->subtype)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3038

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3039 struct convert_eol_coding_stream

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3040 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3041 enum eol_type actual;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3042 };

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3043

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3044 static const struct lrecord_description

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3045 convert_eol_coding_system_description[] = {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3046 { XD_END }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3047 };

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3048

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3049 static void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3050 convert_eol_print (Lisp_Object cs, Lisp_Object printcharfun, int escapeflag)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3051 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3052 struct convert_eol_coding_system *data =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3053 XCODING_SYSTEM_TYPE_DATA (cs, convert_eol);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3054

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3055 write_fmt_string (printcharfun, "(%s)",

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3056 data->subtype == EOL_LF ? "lf" :

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3057 data->subtype == EOL_CRLF ? "crlf" :

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3058 data->subtype == EOL_CR ? "cr" :

793

e38acbeb1cae [xemacs-hg @ 2002-03-29 04:46:17 by ben]

ben

parents: 778

diff changeset

3059 data->subtype == EOL_AUTODETECT ? "nil" :

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3060 (abort(), ""));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3061 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3062

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3063 static enum source_sink_type

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3064 convert_eol_conversion_end_type (Lisp_Object codesys)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3065 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3066 return DECODES_CHARACTER_TO_CHARACTER;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3067 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3068

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3069 static int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3070 convert_eol_putprop (Lisp_Object codesys,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3071 Lisp_Object key,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3072 Lisp_Object value)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3073 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3074 struct convert_eol_coding_system *data =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3075 XCODING_SYSTEM_TYPE_DATA (codesys, convert_eol);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3076

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3077 if (EQ (key, Qsubtype))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3078 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3079 if (EQ (value, Qlf) /* || EQ (value, Qunix) */)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3080 data->subtype = EOL_LF;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3081 else if (EQ (value, Qcrlf) /* || EQ (value, Qdos) */)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3082 data->subtype = EOL_CRLF;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3083 else if (EQ (value, Qcr) /* || EQ (value, Qmac) */)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3084 data->subtype = EOL_CR;

793

e38acbeb1cae [xemacs-hg @ 2002-03-29 04:46:17 by ben]

ben

parents: 778

diff changeset

3085 else if (EQ (value, Qnil))

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3086 data->subtype = EOL_AUTODETECT;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3087 else invalid_constant ("Unrecognized eol type", value);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3088 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3089 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3090 return 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3091 return 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3092 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3093

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3094 static Lisp_Object

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3095 convert_eol_getprop (Lisp_Object coding_system, Lisp_Object prop)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3096 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3097 struct convert_eol_coding_system *data =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3098 XCODING_SYSTEM_TYPE_DATA (coding_system, convert_eol);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3099

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3100 if (EQ (prop, Qsubtype))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3101 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3102 switch (data->subtype)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3103 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3104 case EOL_LF: return Qlf;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3105 case EOL_CRLF: return Qcrlf;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3106 case EOL_CR: return Qcr;

793

e38acbeb1cae [xemacs-hg @ 2002-03-29 04:46:17 by ben]

ben

parents: 778

diff changeset

3107 case EOL_AUTODETECT: return Qnil;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3108 default: abort ();

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3109 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3110 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3111

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3112 return Qunbound;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3113 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3114

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3115 static void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3116 convert_eol_init_coding_stream (struct coding_stream *str)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3117 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3118 struct convert_eol_coding_stream *data =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3119 CODING_STREAM_TYPE_DATA (str, convert_eol);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3120 data->actual = XCODING_SYSTEM_CONVERT_EOL_SUBTYPE (str->codesys);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3121 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3122

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3123 static Bytecount

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 851

diff changeset

3124 convert_eol_convert (struct coding_stream *str, const Ibyte *src,

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3125 unsigned_char_dynarr *dst, Bytecount n)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3126 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3127 if (str->direction == CODING_DECODE)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3128 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3129 struct convert_eol_coding_stream *data =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3130 CODING_STREAM_TYPE_DATA (str, convert_eol);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3131

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3132 if (data->actual == EOL_AUTODETECT)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3133 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3134 Bytecount n2 = n;

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 851

diff changeset

3135 const Ibyte *src2 = src;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3136

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3137 for (; n2; n2--)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3138 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 851

diff changeset

3139 Ibyte c = *src2++;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3140 if (c == '\n')

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3141 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3142 data->actual = EOL_LF;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3143 break;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3144 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3145 else if (c == '\r')

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3146 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3147 if (n2 == 1)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3148 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3149 /* If we're seeing a '\r' at the end of the data, then

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3150 reject the '\r' right now so it doesn't become an

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3151 issue in the code below -- unless we're at the end of

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3152 the stream, in which case we can't do that (because

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3153 then the '\r' will never get written out), and in any

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3154 case we should be recognizing it at EOL_CR format. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3155 if (str->eof)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3156 data->actual = EOL_CR;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3157 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3158 n--;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3159 break;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3160 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3161 else if (*src2 == '\n')

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3162 data->actual = EOL_CRLF;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3163 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3164 data->actual = EOL_CR;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3165 break;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3166 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3167 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3168 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3169

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3170 /* str->eof is set, the caller reached EOF on the other end and has

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3171 no new data to give us. The only data we get is the data we

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3172 rejected from last time. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3173 if (data->actual == EOL_LF || data->actual == EOL_AUTODETECT ||

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3174 (str->eof))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3175 Dynarr_add_many (dst, src, n);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3176 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3177 {

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 851

diff changeset

3178 const Ibyte *end = src + n;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3179 while (1)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3180 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3181 /* Find the next section with no \r and add it. */

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 851

diff changeset

3182 const Ibyte *runstart = src;

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 851

diff changeset

3183 src = (Ibyte *) memchr (src, '\r', end - src);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3184 if (!src)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3185 src = end;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3186 Dynarr_add_many (dst, runstart, src - runstart);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3187 /* Stop if at end ... */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3188 if (src == end)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3189 break;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3190 /* ... else, translate as necessary. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3191 src++;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3192 if (data->actual == EOL_CR)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3193 Dynarr_add (dst, '\n');

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3194 /* We need to be careful here with CRLF. If we see a CR at the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3195 end of the data, we don't know if it's part of a CRLF, so we

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3196 reject it. Otherwise: If it's part of a CRLF, eat it and

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3197 loop; the following LF gets added next time around. If it's

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3198 not part of a CRLF, add the CR and loop. The following

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3199 character will be processed in the next loop iteration. This

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3200 correctly handles a sequence like CR+CR+LF. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3201 else if (src == end)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3202 return n - 1; /* reject the CR at the end; we'll get it again

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3203 next time the convert method is called */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3204 else if (*src != '\n')

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3205 Dynarr_add (dst, '\r');

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3206 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3207 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3208

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3209 return n;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3210 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3211 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3212 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3213 enum eol_type subtype =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3214 XCODING_SYSTEM_CONVERT_EOL_SUBTYPE (str->codesys);

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 851

diff changeset

3215 const Ibyte *end = src + n;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3216

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3217 /* We try to be relatively efficient here. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3218 if (subtype == EOL_LF)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3219 Dynarr_add_many (dst, src, n);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3220 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3221 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3222 while (1)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3223 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3224 /* Find the next section with no \n and add it. */

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 851

diff changeset

3225 const Ibyte *runstart = src;

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 851

diff changeset

3226 src = (Ibyte *) memchr (src, '\n', end - src);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3227 if (!src)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3228 src = end;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3229 Dynarr_add_many (dst, runstart, src - runstart);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3230 /* Stop if at end ... */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3231 if (src == end)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3232 break;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3233 /* ... else, skip over \n and add its translation. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3234 src++;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3235 Dynarr_add (dst, '\r');

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3236 if (subtype == EOL_CRLF)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3237 Dynarr_add (dst, '\n');

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3238 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3239 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3240

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3241 return n;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3242 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3243 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3244

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3245 static Lisp_Object

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3246 convert_eol_canonicalize_after_coding (struct coding_stream *str)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3247 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3248 struct convert_eol_coding_stream *data =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3249 CODING_STREAM_TYPE_DATA (str, convert_eol);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3250

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3251 if (str->direction == CODING_ENCODE)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3252 return str->codesys;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3253

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3254 switch (data->actual)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3255 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3256 case EOL_LF: return Fget_coding_system (Qconvert_eol_lf);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3257 case EOL_CRLF: return Fget_coding_system (Qconvert_eol_crlf);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3258 case EOL_CR: return Fget_coding_system (Qconvert_eol_cr);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3259 case EOL_AUTODETECT: return str->codesys;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3260 default: abort (); return Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3261 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3262 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3263

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3264

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3265 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3266 /* Undecided methods */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3267 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3268

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3269 /* Do autodetection. We can autodetect the EOL type only, the coding

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3270 system only, or both. We only do autodetection when decoding; when

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3271 encoding, we just pass the data through.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3272

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3273 When doing just EOL detection, a coding system can be specified; if so,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3274 we will decode this data through the coding system before doing EOL

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3275 detection. The reason for specifying this is so that

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3276 canonicalize-after-coding works: We will canonicalize the specified

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3277 coding system into the appropriate EOL type. When doing both coding and

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3278 EOL detection, we do similar canonicalization, and also catch situations

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3279 where the EOL type is overspecified, i.e. the detected coding system

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3280 specifies an EOL type, and either switch to the equivalent

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3281 non-EOL-processing coding system (if possible), or terminate EOL

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3282 detection and use the specified EOL type. This prevents data from being

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3283 EOL-processed twice.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3284 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3285

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3286 DEFINE_CODING_SYSTEM_TYPE (undecided);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3287

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3288 struct undecided_coding_system

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3289 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3290 int do_eol, do_coding;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3291 Lisp_Object cs;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3292 };

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3293

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3294 struct undecided_coding_stream

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3295 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3296 Lisp_Object actual;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3297 /* Either 2 or 3 lstreams here; see undecided_convert */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3298 struct chain_coding_stream c;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3299

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3300 struct detection_state *st;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3301 };

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3302

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3303 static const struct lrecord_description

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3304 undecided_coding_system_description[] = {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3305 { XD_LISP_OBJECT,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3306 coding_system_data_offset + offsetof (struct undecided_coding_system,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3307 cs) },

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3308 { XD_END }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3309 };

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3310

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3311 static void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3312 undecided_init (Lisp_Object codesys)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3313 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3314 struct undecided_coding_system *data =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3315 XCODING_SYSTEM_TYPE_DATA (codesys, undecided);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3316

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3317 data->cs = Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3318 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3319

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3320 static void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3321 undecided_mark (Lisp_Object codesys)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3322 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3323 struct undecided_coding_system *data =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3324 XCODING_SYSTEM_TYPE_DATA (codesys, undecided);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3325

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3326 mark_object (data->cs);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3327 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3328

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3329 static void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3330 undecided_print (Lisp_Object cs, Lisp_Object printcharfun, int escapeflag)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3331 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3332 struct undecided_coding_system *data =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3333 XCODING_SYSTEM_TYPE_DATA (cs, undecided);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3334 int need_space = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3335

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3336 write_c_string (printcharfun, "(");

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3337 if (data->do_eol)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3338 {

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3339 write_c_string (printcharfun, "do-eol");

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3340 need_space = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3341 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3342 if (data->do_coding)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3343 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3344 if (need_space)

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3345 write_c_string (printcharfun, " ");

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3346 write_c_string (printcharfun, "do-coding");

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3347 need_space = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3348 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3349 if (!NILP (data->cs))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3350 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3351 if (need_space)

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3352 write_c_string (printcharfun, " ");

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3353 write_c_string (printcharfun, "coding-system=");

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3354 print_coding_system_in_print_method (data->cs, printcharfun, escapeflag);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3355 }

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

3356 write_c_string (printcharfun, ")");

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3357 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3358

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3359 static void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3360 undecided_mark_coding_stream (struct coding_stream *str)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3361 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3362 chain_mark_coding_stream_1 (&CODING_STREAM_TYPE_DATA (str, undecided)->c);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3363 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3364

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3365 static int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3366 undecided_putprop (Lisp_Object codesys, Lisp_Object key, Lisp_Object value)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3367 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3368 struct undecided_coding_system *data =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3369 XCODING_SYSTEM_TYPE_DATA (codesys, undecided);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3370

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3371 if (EQ (key, Qdo_eol))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3372 data->do_eol = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3373 else if (EQ (key, Qdo_coding))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3374 data->do_coding = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3375 else if (EQ (key, Qcoding_system))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3376 data->cs = get_coding_system_for_text_file (value, 0);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3377 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3378 return 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3379 return 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3380 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3381

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3382 static Lisp_Object

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3383 undecided_getprop (Lisp_Object codesys, Lisp_Object prop)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3384 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3385 struct undecided_coding_system *data =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3386 XCODING_SYSTEM_TYPE_DATA (codesys, undecided);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3387

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3388 if (EQ (prop, Qdo_eol))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3389 return data->do_eol ? Qt : Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3390 if (EQ (prop, Qdo_coding))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3391 return data->do_coding ? Qt : Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3392 if (EQ (prop, Qcoding_system))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3393 return data->cs;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3394 return Qunbound;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3395 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3396

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3397 static struct detection_state *

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3398 allocate_detection_state (void)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3399 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3400 int i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3401 Bytecount size = MAX_ALIGN_SIZE (sizeof (struct detection_state));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3402 struct detection_state *block;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3403

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3404 for (i = 0; i < coding_detector_count; i++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3405 size += MAX_ALIGN_SIZE (Dynarr_at (all_coding_detectors, i).data_size);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3406

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3407 block = (struct detection_state *) xmalloc_and_zero (size);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3408

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3409 size = MAX_ALIGN_SIZE (sizeof (struct detection_state));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3410 for (i = 0; i < coding_detector_count; i++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3411 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3412 block->data_offset[i] = size;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3413 size += MAX_ALIGN_SIZE (Dynarr_at (all_coding_detectors, i).data_size);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3414 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3415

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3416 return block;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3417 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3418

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3419 static void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3420 free_detection_state (struct detection_state *st)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3421 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3422 int i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3423

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3424 for (i = 0; i < coding_detector_count; i++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3425 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3426 if (Dynarr_at (all_coding_detectors, i).finalize_detection_state_method)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3427 Dynarr_at (all_coding_detectors, i).finalize_detection_state_method

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3428 (st);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3429 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3430

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3431 xfree (st);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3432 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3433

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3434 static int

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3435 coding_category_symbol_to_id (Lisp_Object symbol)

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3436 {

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3437 int i;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3438

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3439 CHECK_SYMBOL (symbol);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3440 for (i = 0; i < coding_detector_count; i++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3441 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3442 detector_category_dynarr *cats =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3443 Dynarr_at (all_coding_detectors, i).cats;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3444 int j;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3445

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3446 for (j = 0; j < Dynarr_length (cats); j++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3447 if (EQ (Dynarr_at (cats, j).sym, symbol))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3448 return Dynarr_at (cats, j).id;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3449 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3450

563

183866b06e0b [xemacs-hg @ 2001-05-24 07:50:48 by ben]

ben

parents: 528

diff changeset

3451 invalid_constant ("Unrecognized coding category", symbol);

801

2b676dc88c66 [xemacs-hg @ 2002-04-01 03:58:02 by ben]

ben

parents: 800

diff changeset

3452 RETURN_NOT_REACHED (0)

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3453 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3454

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3455 static Lisp_Object

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3456 coding_category_id_to_symbol (int id)

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3457 {

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3458 int i;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3459

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3460 for (i = 0; i < coding_detector_count; i++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3461 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3462 detector_category_dynarr *cats =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3463 Dynarr_at (all_coding_detectors, i).cats;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3464 int j;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3465

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3466 for (j = 0; j < Dynarr_length (cats); j++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3467 if (id == Dynarr_at (cats, j).id)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3468 return Dynarr_at (cats, j).sym;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3469 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3470

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3471 abort ();

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3472 return Qnil; /* (usually) not reached */

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3473 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3474

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3475 static Lisp_Object

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3476 detection_result_number_to_symbol (enum detection_result result)

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3477 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3478 #define FROB(sym, num) if (result == num) return (sym)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3479 FROB (Qnear_certainty, DET_NEAR_CERTAINTY);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3480 FROB (Qquite_probable, DET_QUITE_PROBABLE);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3481 FROB (Qsomewhat_likely, DET_SOMEWHAT_LIKELY);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3482 FROB (Qas_likely_as_unlikely, DET_AS_LIKELY_AS_UNLIKELY);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3483 FROB (Qsomewhat_unlikely, DET_SOMEWHAT_UNLIKELY);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3484 FROB (Qquite_improbable, DET_QUITE_IMPROBABLE);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3485 FROB (Qnearly_impossible, DET_NEARLY_IMPOSSIBLE);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3486 #undef FROB

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3487

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3488 abort ();

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3489 return Qnil; /* (usually) not reached */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3490 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3491

778

2923009caf47 [xemacs-hg @ 2002-03-16 10:38:59 by ben]

ben

parents: 771

diff changeset

3492 #if 0 /* not used */

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3493 static enum detection_result

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3494 detection_result_symbol_to_number (Lisp_Object symbol)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3495 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3496 #define FROB(sym, num) if (EQ (symbol, sym)) return (num)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3497 FROB (Qnear_certainty, DET_NEAR_CERTAINTY);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3498 FROB (Qquite_probable, DET_QUITE_PROBABLE);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3499 FROB (Qsomewhat_likely, DET_SOMEWHAT_LIKELY);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3500 FROB (Qas_likely_as_unlikely, DET_AS_LIKELY_AS_UNLIKELY);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3501 FROB (Qsomewhat_unlikely, DET_SOMEWHAT_UNLIKELY);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3502 FROB (Qquite_improbable, DET_QUITE_IMPROBABLE);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3503 FROB (Qnearly_impossible, DET_NEARLY_IMPOSSIBLE);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3504 #undef FROB

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3505

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3506 invalid_constant ("Unrecognized detection result", symbol);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3507 return ((enum detection_result) 0); /* not reached */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3508 }

778

2923009caf47 [xemacs-hg @ 2002-03-16 10:38:59 by ben]

ben

parents: 771

diff changeset

3509 #endif /* 0 */

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3510

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3511 /* Set all detection results for a given detector to a specified value. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3512 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3513 set_detection_results (struct detection_state *st, int detector, int given)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3514 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3515 detector_category_dynarr *cats =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3516 Dynarr_at (all_coding_detectors, detector).cats;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3517 int i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3518

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3519 for (i = 0; i < Dynarr_length (cats); i++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3520 st->categories[Dynarr_at (cats, i).id] = given;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3521 }

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3522

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3523 static int

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3524 acceptable_control_char_p (int c)

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3525 {

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3526 switch (c)

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3527 {

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3528 /* Allow and ignore control characters that you might

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3529 reasonably see in a text file */

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3530 case '\r':

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3531 case '\n':

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3532 case '\t':

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3533 case 7: /* bell */

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3534 case 8: /* backspace */

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3535 case 11: /* vertical tab */

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3536 case 12: /* form feed */

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3537 case 26: /* MS-DOS C-z junk */

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3538 case 31: /* '^_' -- for info */

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3539 return 1;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3540 default:

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3541 return 0;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3542 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3543 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3544

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3545 #ifdef DEBUG_XEMACS

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3546

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3547 static UExtbyte

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3548 hex_digit_to_char (int digit)

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3549 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3550 if (digit < 10)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3551 return digit + '0';

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3552 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3553 return digit - 10 + 'A';

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3554 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3555

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3556 static void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3557 output_bytes_in_ascii_and_hex (const UExtbyte *src, Bytecount n)

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3558 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3559 UExtbyte *ascii = alloca_array (UExtbyte, n + 1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3560 UExtbyte *hex = alloca_array (UExtbyte, 3 * n + 1);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3561 int i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3562

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3563 for (i = 0; i < n; i++)

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3564 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3565 UExtbyte c = src[i];

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3566 if (c < 0x20)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3567 ascii[i] = '.';

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3568 else

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3569 ascii[i] = c;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3570 hex[3 * i] = hex_digit_to_char (c >> 4);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3571 hex[3 * i + 1] = hex_digit_to_char (c & 0xF);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3572 hex[3 * i + 2] = ' ';

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3573 }

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3574 ascii[i] = '\0';

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3575 hex[3 * i - 1] = '\0';

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3576 stderr_out ("%s %s", ascii, hex);

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3577 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3578

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3579 #endif /* DEBUG_XEMACS */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3580

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3581 /* Attempt to determine the encoding of the given text. Before calling

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3582 this function for the first time, you must zero out the detection state.

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3583

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3584 Returns:

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3585

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3586 0 == keep going

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3587 1 == stop

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3588 */

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3589

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3590 static int

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3591 detect_coding_type (struct detection_state *st, const UExtbyte *src,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3592 Bytecount n)

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3593 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3594 Bytecount n2 = n;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3595 const UExtbyte *src2 = src;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3596 int i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3597

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3598 #ifdef DEBUG_XEMACS

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3599 if (!NILP (Vdebug_coding_detection))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3600 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3601 int bytes = min (16, n);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3602 stderr_out ("detect_coding_type: processing %ld bytes\n", n);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3603 stderr_out ("First %d: ", bytes);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3604 output_bytes_in_ascii_and_hex (src, bytes);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3605 stderr_out ("\nLast %d: ", bytes);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3606 output_bytes_in_ascii_and_hex (src + n - bytes, bytes);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3607 stderr_out ("\n");

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3608 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3609 #endif /* DEBUG_XEMACS */

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3610 if (!st->seen_non_ascii)

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3611 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3612 for (; n2; n2--, src2++)

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3613 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3614 UExtbyte c = *src2;

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3615 if ((c < 0x20 && !acceptable_control_char_p (c)) || c >= 0x80)

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3616 {

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3617 st->seen_non_ascii = 1;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3618 break;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3619 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3620 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3621 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3622

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3623 for (i = 0; i < coding_detector_count; i++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3624 Dynarr_at (all_coding_detectors, i).detect_method (st, src, n);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3625

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3626 st->bytes_seen += n;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3627

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3628 #ifdef DEBUG_XEMACS

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3629 if (!NILP (Vdebug_coding_detection))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3630 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3631 stderr_out ("seen_non_ascii: %d\n", st->seen_non_ascii);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3632 for (i = 0; i < coding_detector_category_count; i++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3633 stderr_out_lisp

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3634 ("%s: %s\n",

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3635 2,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3636 coding_category_id_to_symbol (i),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3637 detection_result_number_to_symbol ((enum detection_result)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3638 st->categories[i]));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3639 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3640 #endif /* DEBUG_XEMACS */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3641

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3642 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3643 int not_unlikely = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3644 int retval;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3645

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3646 for (i = 0; i < coding_detector_category_count; i++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3647 if (st->categories[i] >= 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3648 not_unlikely++;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3649

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3650 retval = (not_unlikely <= 1

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3651 #if 0 /* this is bogus */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3652 || st->bytes_seen >= MAX_BYTES_PROCESSED_FOR_DETECTION

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3653 #endif

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3654 );

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3655

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3656 #ifdef DEBUG_XEMACS

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3657 if (!NILP (Vdebug_coding_detection))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3658 stderr_out ("detect_coding_type: returning %d (%s)\n",

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3659 retval, retval ? "stop" : "keep going");

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3660 #endif /* DEBUG_XEMACS */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3661

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3662 return retval;

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3663 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3664 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3665

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3666 static Lisp_Object

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3667 detected_coding_system (struct detection_state *st)

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3668 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3669 int i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3670 int even = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3671

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3672 if (st->seen_non_ascii)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3673 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3674 for (i = 0; i < coding_detector_category_count; i++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3675 if (st->categories[i] != DET_AS_LIKELY_AS_UNLIKELY)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3676 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3677 even = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3678 break;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3679 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3680 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3681

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3682 /* #### Here we are ignoring the results of detection when it's all

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3683 ASCII. This is obviously a bad thing. But we need to fix up the

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3684 existing detection methods somewhat before we can switch. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3685 if (even)

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3686 {

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3687 /* If the file was entirely or basically ASCII, use the

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3688 default value of `buffer-file-coding-system'. */

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3689 Lisp_Object retval =

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3690 XBUFFER (Vbuffer_defaults)->buffer_file_coding_system;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3691 if (!NILP (retval))

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3692 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3693 retval = find_coding_system_for_text_file (retval, 0);

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3694 if (NILP (retval))

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3695 {

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3696 warn_when_safe

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3697 (Qbad_variable, Qwarning,

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3698 "Invalid `default-buffer-file-coding-system', set to nil");

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3699 XBUFFER (Vbuffer_defaults)->buffer_file_coding_system = Qnil;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3700 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3701 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3702 if (NILP (retval))

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3703 retval = Fget_coding_system (Qraw_text);

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3704 return retval;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3705 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3706 else

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3707 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3708 int likelihood;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3709 Lisp_Object retval = Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3710

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3711 /* Look through the coding categories first by likelihood and then by

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3712 priority and find the first one that is allowed. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3713

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3714 for (likelihood = DET_HIGHEST; likelihood >= DET_LOWEST; likelihood--)

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3715 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3716 for (i = 0; i < coding_detector_category_count; i++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3717 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3718 int cat = coding_category_by_priority[i];

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3719 if (st->categories[cat] == likelihood &&

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3720 !NILP (coding_category_system[cat]))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3721 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3722 retval = (get_coding_system_for_text_file

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3723 (coding_category_system[cat], 0));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3724 if (likelihood < DET_AS_LIKELY_AS_UNLIKELY)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3725 warn_when_safe_lispobj

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3726 (intern ("detection"),

793

e38acbeb1cae [xemacs-hg @ 2002-03-29 04:46:17 by ben]

ben

parents: 778

diff changeset

3727 Qwarning,

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3728 emacs_sprintf_string_lisp

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3729 (

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3730 "Detected coding %s is unlikely to be correct (likelihood == `%s')",

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3731 Qnil, 2, XCODING_SYSTEM_NAME (retval),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3732 detection_result_number_to_symbol

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3733 ((enum detection_result) likelihood)));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3734 return retval;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3735 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3736 }

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3737 }

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3738

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3739 return Fget_coding_system (Qraw_text);

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3740 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3741 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3742

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3743 /* Given a seekable read stream and potential coding system and EOL type

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3744 as specified, do any autodetection that is called for. If the

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3745 coding system and/or EOL type are not `autodetect', they will be left

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3746 alone; but this function will never return an autodetect coding system

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3747 or EOL type.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3748

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3749 This function does not automatically fetch subsidiary coding systems;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3750 that should be unnecessary with the explicit eol-type argument. */

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3751

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3752 #define LENGTH(string_constant) (sizeof (string_constant) - 1)

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3753

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3754 static Lisp_Object

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3755 unwind_free_detection_state (Lisp_Object opaque)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3756 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3757 struct detection_state *st =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3758 (struct detection_state *) get_opaque_ptr (opaque);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3759 free_detection_state (st);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3760 free_opaque_ptr (opaque);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3761 return Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3762 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3763

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3764 static Lisp_Object

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3765 look_for_coding_system_magic_cookie (const UExtbyte *data, Bytecount len)

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3766 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3767 Lisp_Object coding_system = Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3768 const UExtbyte *p;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3769 const UExtbyte *scan_end;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3770

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3771 /* Look for initial "-*-"; mode line prefix */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3772 for (p = data,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3773 scan_end = data + len - LENGTH ("-*-coding:?-*-");

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3774 p <= scan_end

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3775 && *p != '\n'

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3776 && *p != '\r';

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3777 p++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3778 if (*p == '-' && *(p+1) == '*' && *(p+2) == '-')

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3779 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3780 const UExtbyte *local_vars_beg = p + 3;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3781 /* Look for final "-*-"; mode line suffix */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3782 for (p = local_vars_beg,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3783 scan_end = data + len - LENGTH ("-*-");

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3784 p <= scan_end

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3785 && *p != '\n'

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3786 && *p != '\r';

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3787 p++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3788 if (*p == '-' && *(p+1) == '*' && *(p+2) == '-')

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3789 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3790 const UExtbyte *suffix = p;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3791 /* Look for "coding:" */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3792 for (p = local_vars_beg,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3793 scan_end = suffix - LENGTH ("coding:?");

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3794 p <= scan_end;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3795 p++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3796 if (memcmp ("coding:", p, LENGTH ("coding:")) == 0

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3797 && (p == local_vars_beg

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3798 || (*(p-1) == ' ' ||

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3799 *(p-1) == '\t' ||

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3800 *(p-1) == ';')))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3801 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3802 Bytecount n;

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 851

diff changeset

3803 Ibyte *name;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3804

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3805 p += LENGTH ("coding:");

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3806 while (*p == ' ' || *p == '\t') p++;

867

804517e16990 [xemacs-hg @ 2002-06-05 09:54:39 by ben]

ben

parents: 851

diff changeset

3807 name = alloca_ibytes (suffix - p + 1);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3808 memcpy (name, p, suffix - p);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3809 name[suffix - p] = '\0';

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3810

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3811 /* Get coding system name */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3812 /* Characters valid in a MIME charset name (rfc 1521),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3813 and in a Lisp symbol name. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3814 n = qxestrspn (name,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3815 "ABCDEFGHIJKLMNOPQRSTUVWXYZ"

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3816 "abcdefghijklmnopqrstuvwxyz"

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3817 "0123456789"

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3818 "!$%&*+-.^_{|}~");

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3819 if (n > 0)

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3820 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3821 name[n] = '\0';

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3822 coding_system =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3823 find_coding_system_for_text_file (intern_int (name),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3824 0);

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3825 }

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3826 break;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3827 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3828 break;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3829 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3830 break;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3831 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3832

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3833 return coding_system;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3834 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3835

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3836 static Lisp_Object

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3837 determine_real_coding_system (Lstream *stream)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3838 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3839 struct detection_state *st = allocate_detection_state ();

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3840 int depth = record_unwind_protect (unwind_free_detection_state,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3841 make_opaque_ptr (st));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3842 UExtbyte buf[4096];

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3843 Bytecount nread = Lstream_read (stream, buf, sizeof (buf));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3844 Lisp_Object coding_system = look_for_coding_system_magic_cookie (buf, nread);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3845

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3846 if (NILP (coding_system))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3847 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3848 while (1)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3849 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3850 if (detect_coding_type (st, buf, nread))

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3851 break;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3852 nread = Lstream_read (stream, buf, sizeof (buf));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3853 if (nread == 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3854 break;

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3855 }

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3856

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3857 coding_system = detected_coding_system (st);

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3858 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3859

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

3860 Lstream_rewind (stream);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3861

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3862 unbind_to (depth);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3863 return coding_system;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3864 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3865

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3866 static void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3867 undecided_init_coding_stream (struct coding_stream *str)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3868 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3869 struct undecided_coding_stream *data =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3870 CODING_STREAM_TYPE_DATA (str, undecided);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3871 struct undecided_coding_system *csdata =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3872 XCODING_SYSTEM_TYPE_DATA (str->codesys, undecided);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3873

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3874 data->actual = Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3875

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3876 if (str->direction == CODING_DECODE)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3877 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3878 Lstream *lst = str->other_end;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3879

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3880 if ((lst->flags & LSTREAM_FL_READ) &&

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3881 Lstream_seekable_p (lst) &&

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3882 csdata->do_coding)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3883 /* We can determine the coding system now. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3884 data->actual = determine_real_coding_system (lst);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3885 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3886 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3887

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3888 static void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3889 undecided_rewind_coding_stream (struct coding_stream *str)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3890 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3891 chain_rewind_coding_stream_1 (&CODING_STREAM_TYPE_DATA (str, undecided)->c);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3892 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3893

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3894 static void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3895 undecided_finalize_coding_stream (struct coding_stream *str)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3896 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3897 struct undecided_coding_stream *data =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3898 CODING_STREAM_TYPE_DATA (str, undecided);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3899

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3900 chain_finalize_coding_stream_1

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3901 (&CODING_STREAM_TYPE_DATA (str, undecided)->c);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3902 if (data->st)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3903 free_detection_state (data->st);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3904 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3905

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3906 static Lisp_Object

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3907 undecided_canonicalize (Lisp_Object codesys)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3908 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3909 struct undecided_coding_system *csdata =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3910 XCODING_SYSTEM_TYPE_DATA (codesys, undecided);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3911 if (!csdata->do_eol && !csdata->do_coding)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3912 return NILP (csdata->cs) ? Fget_coding_system (Qbinary) : csdata->cs;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3913 if (csdata->do_eol && !csdata->do_coding && NILP (csdata->cs))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3914 return Fget_coding_system (Qconvert_eol_autodetect);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3915 return codesys;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3916 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3917

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3918 static Bytecount

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3919 undecided_convert (struct coding_stream *str, const UExtbyte *src,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3920 unsigned_char_dynarr *dst, Bytecount n)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3921 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3922 int first_time = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3923

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3924 if (str->direction == CODING_DECODE)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3925 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3926 /* At this point, we have only the following possibilities:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3927

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3928 do_eol && do_coding

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3929 do_coding only

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3930 do_eol only and a coding system was specified

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3931

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3932 Other possibilities are removed during undecided_canonicalize.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3933

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3934 Therefore, our substreams are either

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3935

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3936 lstream_coding -> lstream_dynarr, or

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3937 lstream_coding -> lstream_eol -> lstream_dynarr.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3938 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3939 struct undecided_coding_system *csdata =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3940 XCODING_SYSTEM_TYPE_DATA (str->codesys, undecided);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3941 struct undecided_coding_stream *data =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3942 CODING_STREAM_TYPE_DATA (str, undecided);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3943

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3944 if (str->eof)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3945 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3946 /* Each will close the next. We need to close now because more

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3947 data may be generated. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3948 if (data->c.initted)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3949 Lstream_close (XLSTREAM (data->c.lstreams[0]));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3950 return n;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3951 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3952

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3953 if (!data->c.initted)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3954 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3955 data->c.lstream_count = csdata->do_eol ? 3 : 2;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3956 data->c.lstreams = xnew_array (Lisp_Object, data->c.lstream_count);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3957

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3958 data->c.lstreams[data->c.lstream_count - 1] =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3959 make_dynarr_output_stream (dst);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3960 Lstream_set_buffering

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3961 (XLSTREAM (data->c.lstreams[data->c.lstream_count - 1]),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3962 LSTREAM_UNBUFFERED, 0);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3963 if (csdata->do_eol)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3964 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3965 data->c.lstreams[1] =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3966 make_coding_output_stream

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3967 (XLSTREAM (data->c.lstreams[data->c.lstream_count - 1]),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3968 Fget_coding_system (Qconvert_eol_autodetect),

800

a5954632b187 [xemacs-hg @ 2002-03-31 08:27:14 by ben]

ben

parents: 793

diff changeset

3969 CODING_DECODE, 0);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3970 Lstream_set_buffering

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3971 (XLSTREAM (data->c.lstreams[1]),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3972 LSTREAM_UNBUFFERED, 0);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3973 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3974

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3975 data->c.lstreams[0] =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3976 make_coding_output_stream

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3977 (XLSTREAM (data->c.lstreams[1]),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3978 /* Substitute binary if we need to detect the encoding */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3979 csdata->do_coding ? Qbinary : csdata->cs,

800

a5954632b187 [xemacs-hg @ 2002-03-31 08:27:14 by ben]

ben

parents: 793

diff changeset

3980 CODING_DECODE, 0);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3981 Lstream_set_buffering (XLSTREAM (data->c.lstreams[0]),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3982 LSTREAM_UNBUFFERED, 0);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3983

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3984 first_time = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3985 data->c.initted = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3986 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3987

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3988 /* If necessary, do encoding-detection now. We do this when we're a

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3989 writing stream or a non-seekable reading stream, meaning that we

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3990 can't just process the whole input, rewind, and start over. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3991

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3992 if (csdata->do_coding)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3993 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3994 int actual_was_nil = NILP (data->actual);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3995 if (NILP (data->actual))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3996 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3997 if (!data->st)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3998 data->st = allocate_detection_state ();

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

3999 if (first_time)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4000 /* #### This is cheesy. What we really ought to do is buffer

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4001 up a certain minimum amount of data to get a better result.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4002 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4003 data->actual = look_for_coding_system_magic_cookie (src, n);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4004 if (NILP (data->actual))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4005 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4006 /* #### This is cheesy. What we really ought to do is buffer

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4007 up a certain minimum amount of data so as to get a less

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4008 random result when doing subprocess detection. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4009 detect_coding_type (data->st, src, n);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4010 data->actual = detected_coding_system (data->st);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4011 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4012 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4013 /* We need to set the detected coding system if we actually have

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4014 such a coding system but didn't before. That is the case

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4015 either when we just detected it in the previous code or when

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4016 it was detected during undecided_init_coding_stream(). We

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4017 can check for that using first_time. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4018 if (!NILP (data->actual) && (actual_was_nil || first_time))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4019 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4020 /* If the detected coding system doesn't allow for EOL

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4021 autodetection, try to get the equivalent that does;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4022 otherwise, disable EOL detection (overriding whatever

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4023 may already have been detected). */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4024 if (XCODING_SYSTEM_EOL_TYPE (data->actual) != EOL_AUTODETECT)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4025 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4026 if (!NILP (XCODING_SYSTEM_SUBSIDIARY_PARENT (data->actual)))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4027 data->actual =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4028 XCODING_SYSTEM_SUBSIDIARY_PARENT (data->actual);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4029 else if (data->c.lstream_count == 3)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4030 set_coding_stream_coding_system

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4031 (XLSTREAM (data->c.lstreams[1]),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4032 Fget_coding_system (Qidentity));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4033 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4034 set_coding_stream_coding_system

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4035 (XLSTREAM (data->c.lstreams[0]), data->actual);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4036 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4037 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4038

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4039 if (Lstream_write (XLSTREAM (data->c.lstreams[0]), src, n) < 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4040 return -1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4041 return n;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4042 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4043 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4044 return no_conversion_convert (str, src, dst, n);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4045 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4046

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4047 static Lisp_Object

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4048 undecided_canonicalize_after_coding (struct coding_stream *str)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4049 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4050 struct undecided_coding_stream *data =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4051 CODING_STREAM_TYPE_DATA (str, undecided);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4052 Lisp_Object ret, eolret;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4053

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4054 if (str->direction == CODING_ENCODE)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4055 return str->codesys;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4056

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4057 if (!data->c.initted)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4058 return Fget_coding_system (Qundecided);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4059

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4060 ret = coding_stream_canonicalize_after_coding

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4061 (XLSTREAM (data->c.lstreams[0]));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4062 if (NILP (ret))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4063 ret = Fget_coding_system (Qundecided);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4064 if (XCODING_SYSTEM_EOL_TYPE (ret) != EOL_AUTODETECT)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4065 return ret;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4066 eolret = coding_stream_canonicalize_after_coding

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4067 (XLSTREAM (data->c.lstreams[1]));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4068 if (!EQ (XCODING_SYSTEM_TYPE (eolret), Qconvert_eol))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4069 return ret;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4070 return

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4071 Fsubsidiary_coding_system (ret, Fcoding_system_property (eolret,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4072 Qsubtype));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4073 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4074

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4075

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4076 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4077 /* Lisp interface: Coding category functions and detection */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4078 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4079

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4080 DEFUN ("coding-category-list", Fcoding_category_list, 0, 0, 0, /*

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4081 Return a list of all recognized coding categories.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4082 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4083 ())

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4084 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4085 int i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4086 Lisp_Object list = Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4087

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4088 for (i = 0; i < coding_detector_count; i++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4089 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4090 detector_category_dynarr *cats =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4091 Dynarr_at (all_coding_detectors, i).cats;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4092 int j;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4093

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4094 for (j = 0; j < Dynarr_length (cats); j++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4095 list = Fcons (Dynarr_at (cats, j).sym, list);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4096 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4097

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4098 return Fnreverse (list);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4099 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4100

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4101 DEFUN ("set-coding-priority-list", Fset_coding_priority_list, 1, 1, 0, /*

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4102 Change the priority order of the coding categories.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4103 LIST should be list of coding categories, in descending order of

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4104 priority. Unspecified coding categories will be lower in priority

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4105 than all specified ones, in the same relative order they were in

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4106 previously.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4107 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4108 (list))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4109 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4110 int *category_to_priority =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4111 alloca_array (int, coding_detector_category_count);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4112 int i, j;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4113 Lisp_Object rest;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4114

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4115 /* First generate a list that maps coding categories to priorities. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4116

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4117 for (i = 0; i < coding_detector_category_count; i++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4118 category_to_priority[i] = -1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4119

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4120 /* Highest priority comes from the specified list. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4121 i = 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4122 EXTERNAL_LIST_LOOP (rest, list)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4123 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4124 int cat = coding_category_symbol_to_id (XCAR (rest));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4125

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4126 if (category_to_priority[cat] >= 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4127 sferror ("Duplicate coding category in list", XCAR (rest));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4128 category_to_priority[cat] = i++;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4129 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4130

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4131 /* Now go through the existing categories by priority to retrieve

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4132 the categories not yet specified and preserve their priority

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4133 order. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4134 for (j = 0; j < coding_detector_category_count; j++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4135 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4136 int cat = coding_category_by_priority[j];

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4137 if (category_to_priority[cat] < 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4138 category_to_priority[cat] = i++;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4139 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4140

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4141 /* Now we need to construct the inverse of the mapping we just

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4142 constructed. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4143

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4144 for (i = 0; i < coding_detector_category_count; i++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4145 coding_category_by_priority[category_to_priority[i]] = i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4146

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4147 /* Phew! That was confusing. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4148 return Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4149 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4150

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4151 DEFUN ("coding-priority-list", Fcoding_priority_list, 0, 0, 0, /*

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4152 Return a list of coding categories in descending order of priority.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4153 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4154 ())

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4155 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4156 int i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4157 Lisp_Object list = Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4158

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4159 for (i = 0; i < coding_detector_category_count; i++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4160 list =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4161 Fcons (coding_category_id_to_symbol (coding_category_by_priority[i]),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4162 list);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4163 return Fnreverse (list);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4164 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4165

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4166 DEFUN ("set-coding-category-system", Fset_coding_category_system, 2, 2, 0, /*

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4167 Change the coding system associated with a coding category.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4168 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4169 (coding_category, coding_system))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4170 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4171 coding_category_system[coding_category_symbol_to_id (coding_category)] =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4172 Fget_coding_system (coding_system);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4173 return Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4174 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4175

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4176 DEFUN ("coding-category-system", Fcoding_category_system, 1, 1, 0, /*

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4177 Return the coding system associated with a coding category.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4178 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4179 (coding_category))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4180 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4181 Lisp_Object sys =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4182 coding_category_system[coding_category_symbol_to_id (coding_category)];

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4183

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4184 if (!NILP (sys))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4185 return XCODING_SYSTEM_NAME (sys);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4186 return Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4187 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4188

800

a5954632b187 [xemacs-hg @ 2002-03-31 08:27:14 by ben]

ben

parents: 793

diff changeset

4189 /* Detect the encoding of STREAM. Assumes stream is at the begnning and will

a5954632b187 [xemacs-hg @ 2002-03-31 08:27:14 by ben]

ben

parents: 793

diff changeset

4190 read through to the end of STREAM, leaving it there but open. */

a5954632b187 [xemacs-hg @ 2002-03-31 08:27:14 by ben]

ben

parents: 793

diff changeset

4191

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4192 Lisp_Object

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4193 detect_coding_stream (Lisp_Object stream)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4194 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4195 Lisp_Object val = Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4196 struct gcpro gcpro1, gcpro2, gcpro3;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4197 UExtbyte random_buffer[65536];

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4198 Lisp_Object binary_instream =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4199 make_coding_input_stream

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4200 (XLSTREAM (stream), Qbinary,

814

a634e3b7acc8 [xemacs-hg @ 2002-04-14 12:41:59 by ben]

ben

parents: 802

diff changeset

4201 CODING_ENCODE, LSTREAM_FL_NO_CLOSE_OTHER);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4202 Lisp_Object decstream =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4203 make_coding_input_stream

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4204 (XLSTREAM (binary_instream),

800

a5954632b187 [xemacs-hg @ 2002-03-31 08:27:14 by ben]

ben

parents: 793

diff changeset

4205 Qundecided, CODING_DECODE, 0);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4206 Lstream *decstr = XLSTREAM (decstream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4207

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4208 GCPRO3 (decstream, stream, binary_instream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4209 /* Read and discard all data; detection happens as a side effect of this,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4210 and we examine what was detected afterwards. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4211 while (Lstream_read (decstr, random_buffer, sizeof (random_buffer)) > 0)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4212 ;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4213

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4214 val = coding_stream_detected_coding_system (decstr);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4215 Lstream_close (decstr);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4216 Lstream_delete (decstr);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4217 Lstream_delete (XLSTREAM (binary_instream));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4218 UNGCPRO;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4219 return val;

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4220 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4221

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4222 DEFUN ("detect-coding-region", Fdetect_coding_region, 2, 3, 0, /*

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4223 Detect coding system of the text in the region between START and END.

444

576fb035e263 Import from CVS: tag r21-2-37

cvs

parents: 442

diff changeset

4224 Return a list of possible coding systems ordered by priority.

576fb035e263 Import from CVS: tag r21-2-37

cvs

parents: 442

diff changeset

4225 If only ASCII characters are found, return 'undecided or one of

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4226 its subsidiary coding systems according to a detected end-of-line

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4227 type. Optional arg BUFFER defaults to the current buffer.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4228 */

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4229 (start, end, buffer))

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4230 {

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4231 Lisp_Object val = Qnil;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4232 struct buffer *buf = decode_buffer (buffer, 0);

665

fdefd0186b75 [xemacs-hg @ 2001-09-20 06:28:42 by ben]

ben

parents: 647

diff changeset

4233 Charbpos b, e;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4234 Lisp_Object lb_instream;

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4235

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4236 get_buffer_range_char (buf, start, end, &b, &e, 0);

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4237 lb_instream = make_lisp_buffer_input_stream (buf, b, e, 0);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4238

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4239 val = detect_coding_stream (lb_instream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4240 Lstream_delete (XLSTREAM (lb_instream));

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4241 return val;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4242 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4243

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4244

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4245

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4246 #ifdef DEBUG_XEMACS

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4247

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4248 /************************************************************************/

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4249 /* Internal methods */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4250 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4251

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4252 /* Raw (internally-formatted) data. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4253 DEFINE_CODING_SYSTEM_TYPE (internal);

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4254

665

fdefd0186b75 [xemacs-hg @ 2001-09-20 06:28:42 by ben]

ben

parents: 647

diff changeset

4255 static Bytecount

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4256 internal_convert (struct coding_stream *str, const UExtbyte *src,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4257 unsigned_char_dynarr *dst, Bytecount n)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4258 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4259 Bytecount orign = n;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4260 Dynarr_add_many (dst, src, n);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4261 return orign;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4262 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4263

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4264 #endif /* DEBUG_XEMACS */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4265

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4266

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4267

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4268 #ifdef HAVE_ZLIB

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4269

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4270 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4271 /* Gzip methods */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4272 /************************************************************************/

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4273

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4274 DEFINE_CODING_SYSTEM_TYPE (gzip);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4275

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4276 struct gzip_coding_system

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4277 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4278 int level; /* 0 through 9, or -1 for default */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4279 };

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4280

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4281 #define CODING_SYSTEM_GZIP_LEVEL(codesys) \

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4282 (CODING_SYSTEM_TYPE_DATA (codesys, gzip)->level)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4283 #define XCODING_SYSTEM_GZIP_LEVEL(codesys) \

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4284 (XCODING_SYSTEM_TYPE_DATA (codesys, gzip)->level)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4285

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4286 struct gzip_coding_stream

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4287 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4288 z_stream stream;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4289 int stream_initted;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4290 int reached_eof; /* #### this should be handled by the caller, once we

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4291 return LSTREAM_EOF */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4292 };

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4293

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4294 static const struct lrecord_description

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4295 gzip_coding_system_description[] = {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4296 { XD_END }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4297 };

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4298

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4299 enum source_sink_type

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4300 gzip_conversion_end_type (Lisp_Object codesys)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4301 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4302 return DECODES_BYTE_TO_BYTE;

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4303 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4304

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4305 static void

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4306 gzip_init (Lisp_Object codesys)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4307 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4308 struct gzip_coding_system *data = XCODING_SYSTEM_TYPE_DATA (codesys, gzip);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4309 data->level = -1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4310 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4311

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4312 static void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4313 gzip_print (Lisp_Object cs, Lisp_Object printcharfun, int escapeflag)

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4314 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4315 struct gzip_coding_system *data = XCODING_SYSTEM_TYPE_DATA (cs, gzip);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4316

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

4317 write_c_string (printcharfun, "(");

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4318 if (data->level == -1)

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

4319 write_c_string (printcharfun, "default");

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4320 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4321 print_internal (make_int (data->level), printcharfun, 0);

826

6728e641994e [xemacs-hg @ 2002-05-05 11:30:15 by ben]

ben

parents: 814

diff changeset

4322 write_c_string (printcharfun, ")");

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4323 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4324

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4325 static int

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4326 gzip_putprop (Lisp_Object codesys, Lisp_Object key, Lisp_Object value)

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4327 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4328 struct gzip_coding_system *data = XCODING_SYSTEM_TYPE_DATA (codesys, gzip);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4329

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4330 if (EQ (key, Qlevel))

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4331 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4332 if (EQ (value, Qdefault))

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4333 data->level = -1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4334 else

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4335 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4336 CHECK_INT (value);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4337 check_int_range (XINT (value), 0, 9);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4338 data->level = XINT (value);

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4339 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4340 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4341 else

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4342 return 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4343 return 1;

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4344 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4345

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4346 static Lisp_Object

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4347 gzip_getprop (Lisp_Object coding_system, Lisp_Object prop)

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4348 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4349 struct gzip_coding_system *data =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4350 XCODING_SYSTEM_TYPE_DATA (coding_system, gzip);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4351

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4352 if (EQ (prop, Qlevel))

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4353 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4354 if (data->level == -1)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4355 return Qdefault;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4356 return make_int (data->level);

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4357 }

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4358

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4359 return Qunbound;

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4360 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4361

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4362 static void

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4363 gzip_init_coding_stream (struct coding_stream *str)

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4364 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4365 struct gzip_coding_stream *data = CODING_STREAM_TYPE_DATA (str, gzip);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4366 if (data->stream_initted)

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4367 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4368 if (str->direction == CODING_DECODE)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4369 inflateEnd (&data->stream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4370 else

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4371 deflateEnd (&data->stream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4372 data->stream_initted = 0;

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4373 }

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4374 data->reached_eof = 0;

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4375 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4376

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4377 static void

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4378 gzip_rewind_coding_stream (struct coding_stream *str)

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4379 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4380 gzip_init_coding_stream (str);

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4381 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4382

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4383 static Bytecount

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4384 gzip_convert (struct coding_stream *str,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4385 const UExtbyte *src,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4386 unsigned_char_dynarr *dst, Bytecount n)

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4387 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4388 struct gzip_coding_stream *data = CODING_STREAM_TYPE_DATA (str, gzip);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4389 int zerr;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4390 if (str->direction == CODING_DECODE)

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4391 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4392 if (data->reached_eof)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4393 return n; /* eat the data */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4394

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4395 if (!data->stream_initted)

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4396 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4397 xzero (data->stream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4398 if (inflateInit (&data->stream) != Z_OK)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4399 return LSTREAM_ERROR;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4400 data->stream_initted = 1;

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4401 }

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4402

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4403 data->stream.next_in = (Bytef *) src;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4404 data->stream.avail_in = n;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4405

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4406 /* Normally we stop when we've fed all data to the decompressor; but

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4407 if we're at the end of the input, and the decompressor hasn't

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4408 reported EOF, we need to keep going, as there might be more output

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4409 to generate. Z_OK from the decompressor means input was processed

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4410 or output was generated; if neither, we break out of the loop.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4411 Other return values are:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4412

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4413 Z_STREAM_END EOF from decompressor

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4414 Z_DATA_ERROR Corrupted data

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4415 Z_BUF_ERROR No progress possible (this should happen if

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4416 we try to feed it an incomplete file)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4417 Z_MEM_ERROR Out of memory

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4418 Z_STREAM_ERROR (should never happen)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4419 Z_NEED_DICT (#### when will this happen?)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4420 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4421 while (data->stream.avail_in > 0 || str->eof)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4422 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4423 /* Reserve an output buffer of the same size as the input buffer;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4424 if that's not enough, we keep reserving the same size. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4425 Bytecount reserved = n;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4426 Dynarr_add_many (dst, 0, reserved);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4427 /* Careful here! Don't retrieve the pointer until after

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4428 reserving the space, or it might be bogus */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4429 data->stream.next_out =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4430 Dynarr_atp (dst, Dynarr_length (dst) - reserved);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4431 data->stream.avail_out = reserved;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4432 zerr = inflate (&data->stream, Z_NO_FLUSH);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4433 /* Lop off the unused portion */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4434 Dynarr_set_size (dst, Dynarr_length (dst) - data->stream.avail_out);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4435 if (zerr != Z_OK)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4436 break;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4437 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4438

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4439 if (zerr == Z_STREAM_END)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4440 data->reached_eof = 1;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4441

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4442 if ((Bytecount) data->stream.avail_in < n)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4443 return n - data->stream.avail_in;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4444

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4445 if (zerr == Z_OK || zerr == Z_STREAM_END)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4446 return 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4447

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4448 return LSTREAM_ERROR;

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4449 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4450 else

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4451 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4452 if (!data->stream_initted)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4453 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4454 int level = XCODING_SYSTEM_GZIP_LEVEL (str->codesys);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4455 xzero (data->stream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4456 if (deflateInit (&data->stream,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4457 level == -1 ? Z_DEFAULT_COMPRESSION : level) !=

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4458 Z_OK)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4459 return LSTREAM_ERROR;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4460 data->stream_initted = 1;

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4461 }

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4462

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4463 data->stream.next_in = (Bytef *) src;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4464 data->stream.avail_in = n;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4465

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4466 /* Normally we stop when we've fed all data to the compressor; but if

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4467 we're at the end of the input, and the compressor hasn't reported

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4468 EOF, we need to keep going, as there might be more output to

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4469 generate. (To signal EOF on our end, we set the FLUSH parameter

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4470 to Z_FINISH; when all data is output, Z_STREAM_END will be

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4471 returned.) Z_OK from the compressor means input was processed or

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4472 output was generated; if neither, we break out of the loop. Other

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4473 return values are:

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4474

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4475 Z_STREAM_END EOF from compressor

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4476 Z_BUF_ERROR No progress possible (should never happen)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4477 Z_STREAM_ERROR (should never happen)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4478 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4479 while (data->stream.avail_in > 0 || str->eof)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4480 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4481 /* Reserve an output buffer of the same size as the input buffer;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4482 if that's not enough, we keep reserving the same size. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4483 Bytecount reserved = n;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4484 Dynarr_add_many (dst, 0, reserved);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4485 /* Careful here! Don't retrieve the pointer until after

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4486 reserving the space, or it might be bogus */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4487 data->stream.next_out =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4488 Dynarr_atp (dst, Dynarr_length (dst) - reserved);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4489 data->stream.avail_out = reserved;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4490 zerr =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4491 deflate (&data->stream,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4492 str->eof ? Z_FINISH : Z_NO_FLUSH);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4493 /* Lop off the unused portion */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4494 Dynarr_set_size (dst, Dynarr_length (dst) - data->stream.avail_out);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4495 if (zerr != Z_OK)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4496 break;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4497 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4498

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4499 if ((Bytecount) data->stream.avail_in < n)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4500 return n - data->stream.avail_in;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4501

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4502 if (zerr == Z_OK || zerr == Z_STREAM_END)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4503 return 0;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4504

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4505 return LSTREAM_ERROR;

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4506 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4507 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4508

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4509 #endif /* HAVE_ZLIB */

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4510

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4511

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4512 /************************************************************************/

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4513 /* Initialization */

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4514 /************************************************************************/

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4515

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4516 void

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4517 syms_of_file_coding (void)

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4518 {

442

abe6d1db359e Import from CVS: tag r21-2-36

cvs

parents: 440

diff changeset

4519 INIT_LRECORD_IMPLEMENTATION (coding_system);

abe6d1db359e Import from CVS: tag r21-2-36

cvs

parents: 440

diff changeset

4520

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4521 DEFSUBR (Fvalid_coding_system_type_p);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4522 DEFSUBR (Fcoding_system_type_list);

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4523 DEFSUBR (Fcoding_system_p);

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4524 DEFSUBR (Ffind_coding_system);

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4525 DEFSUBR (Fget_coding_system);

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4526 DEFSUBR (Fcoding_system_list);

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4527 DEFSUBR (Fcoding_system_name);

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4528 DEFSUBR (Fmake_coding_system);

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4529 DEFSUBR (Fcopy_coding_system);

440

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

4530 DEFSUBR (Fcoding_system_canonical_name_p);

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

4531 DEFSUBR (Fcoding_system_alias_p);

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

4532 DEFSUBR (Fcoding_system_aliasee);

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4533 DEFSUBR (Fdefine_coding_system_alias);

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4534 DEFSUBR (Fsubsidiary_coding_system);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4535 DEFSUBR (Fcoding_system_base);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4536 DEFSUBR (Fcoding_system_used_for_io);

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4537

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4538 DEFSUBR (Fcoding_system_type);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4539 DEFSUBR (Fcoding_system_description);

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4540 DEFSUBR (Fcoding_system_property);

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4541

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4542 DEFSUBR (Fcoding_category_list);

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4543 DEFSUBR (Fset_coding_priority_list);

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4544 DEFSUBR (Fcoding_priority_list);

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4545 DEFSUBR (Fset_coding_category_system);

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4546 DEFSUBR (Fcoding_category_system);

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4547

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4548 DEFSUBR (Fdetect_coding_region);

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4549 DEFSUBR (Fdecode_coding_region);

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4550 DEFSUBR (Fencode_coding_region);

563

183866b06e0b [xemacs-hg @ 2001-05-24 07:50:48 by ben]

ben

parents: 528

diff changeset

4551 DEFSYMBOL_MULTIWORD_PREDICATE (Qcoding_systemp);

183866b06e0b [xemacs-hg @ 2001-05-24 07:50:48 by ben]

ben

parents: 528

diff changeset

4552 DEFSYMBOL (Qno_conversion);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4553 DEFSYMBOL (Qconvert_eol);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4554 DEFSYMBOL (Qconvert_eol_autodetect);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4555 DEFSYMBOL (Qconvert_eol_lf);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4556 DEFSYMBOL (Qconvert_eol_cr);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4557 DEFSYMBOL (Qconvert_eol_crlf);

563

183866b06e0b [xemacs-hg @ 2001-05-24 07:50:48 by ben]

ben

parents: 528

diff changeset

4558 DEFSYMBOL (Qraw_text);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4559

563

183866b06e0b [xemacs-hg @ 2001-05-24 07:50:48 by ben]

ben

parents: 528

diff changeset

4560 DEFSYMBOL (Qmnemonic);

183866b06e0b [xemacs-hg @ 2001-05-24 07:50:48 by ben]

ben

parents: 528

diff changeset

4561 DEFSYMBOL (Qeol_type);

183866b06e0b [xemacs-hg @ 2001-05-24 07:50:48 by ben]

ben

parents: 528

diff changeset

4562 DEFSYMBOL (Qpost_read_conversion);

183866b06e0b [xemacs-hg @ 2001-05-24 07:50:48 by ben]

ben

parents: 528

diff changeset

4563 DEFSYMBOL (Qpre_write_conversion);

183866b06e0b [xemacs-hg @ 2001-05-24 07:50:48 by ben]

ben

parents: 528

diff changeset

4564

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4565 DEFSYMBOL (Qtranslation_table_for_decode);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4566 DEFSYMBOL (Qtranslation_table_for_encode);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4567 DEFSYMBOL (Qsafe_chars);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4568 DEFSYMBOL (Qsafe_charsets);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4569 DEFSYMBOL (Qmime_charset);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4570 DEFSYMBOL (Qvalid_codes);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4571

563

183866b06e0b [xemacs-hg @ 2001-05-24 07:50:48 by ben]

ben

parents: 528

diff changeset

4572 DEFSYMBOL (Qcr);

183866b06e0b [xemacs-hg @ 2001-05-24 07:50:48 by ben]

ben

parents: 528

diff changeset

4573 DEFSYMBOL (Qlf);

183866b06e0b [xemacs-hg @ 2001-05-24 07:50:48 by ben]

ben

parents: 528

diff changeset

4574 DEFSYMBOL (Qcrlf);

183866b06e0b [xemacs-hg @ 2001-05-24 07:50:48 by ben]

ben

parents: 528

diff changeset

4575 DEFSYMBOL (Qeol_cr);

183866b06e0b [xemacs-hg @ 2001-05-24 07:50:48 by ben]

ben

parents: 528

diff changeset

4576 DEFSYMBOL (Qeol_lf);

183866b06e0b [xemacs-hg @ 2001-05-24 07:50:48 by ben]

ben

parents: 528

diff changeset

4577 DEFSYMBOL (Qeol_crlf);

183866b06e0b [xemacs-hg @ 2001-05-24 07:50:48 by ben]

ben

parents: 528

diff changeset

4578 DEFSYMBOL (Qencode);

183866b06e0b [xemacs-hg @ 2001-05-24 07:50:48 by ben]

ben

parents: 528

diff changeset

4579 DEFSYMBOL (Qdecode);

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4580

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4581 DEFSYMBOL (Qnear_certainty);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4582 DEFSYMBOL (Qquite_probable);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4583 DEFSYMBOL (Qsomewhat_likely);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4584 DEFSYMBOL (Qas_likely_as_unlikely);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4585 DEFSYMBOL (Qsomewhat_unlikely);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4586 DEFSYMBOL (Qquite_improbable);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4587 DEFSYMBOL (Qnearly_impossible);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4588

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4589 DEFSYMBOL (Qdo_eol);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4590 DEFSYMBOL (Qdo_coding);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4591

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4592 DEFSYMBOL (Qcanonicalize_after_coding);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4593

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4594 DEFSYMBOL (Qescape_quoted);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4595

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4596 #ifdef HAVE_ZLIB

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4597 DEFSYMBOL (Qgzip);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4598 #endif

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4599

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4600 /* WARNING: The existing categories are intimately tied to the function

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4601 `coding-system-category' in coding.el. If you change a category, or

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4602 change the layout of any coding system associated with a category, you

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4603 need to check that function and make sure it's written properly. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4604

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4605 #ifdef HAVE_DEFAULT_EOL_DETECTION

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4606 Fprovide (intern ("unix-default-eol-detection"));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4607 #endif

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4608 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4609

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4610 void

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4611 lstream_type_create_file_coding (void)

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4612 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4613 LSTREAM_HAS_METHOD (coding, reader);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4614 LSTREAM_HAS_METHOD (coding, writer);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4615 LSTREAM_HAS_METHOD (coding, rewinder);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4616 LSTREAM_HAS_METHOD (coding, seekable_p);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4617 LSTREAM_HAS_METHOD (coding, marker);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4618 LSTREAM_HAS_METHOD (coding, flusher);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4619 LSTREAM_HAS_METHOD (coding, closer);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4620 LSTREAM_HAS_METHOD (coding, finalizer);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4621 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4622

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4623 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4624 coding_system_type_create (void)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4625 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4626 int i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4627

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4628 staticpro (&Vcoding_system_hash_table);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4629 Vcoding_system_hash_table =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4630 make_lisp_hash_table (50, HASH_TABLE_NON_WEAK, HASH_TABLE_EQ);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4631

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4632 the_coding_system_type_entry_dynarr = Dynarr_new (coding_system_type_entry);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4633 dump_add_root_struct_ptr (&the_coding_system_type_entry_dynarr,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4634 &csted_description);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4635

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4636 Vcoding_system_type_list = Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4637 staticpro (&Vcoding_system_type_list);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4638

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4639 /* Initialize to something reasonable ... */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4640 for (i = 0; i < MAX_DETECTOR_CATEGORIES; i++)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4641 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4642 coding_category_system[i] = Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4643 dump_add_root_object (&coding_category_system[i]);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4644 coding_category_by_priority[i] = i;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4645 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4646

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4647 dump_add_opaque (coding_category_by_priority,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4648 sizeof (coding_category_by_priority));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4649

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4650 all_coding_detectors = Dynarr_new2 (detector_dynarr, struct detector);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4651 dump_add_root_struct_ptr (&all_coding_detectors,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4652 &detector_dynarr_description);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4653

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4654 dump_add_opaque_int (&coding_system_tick);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4655 dump_add_opaque_int (&coding_detector_count);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4656 dump_add_opaque_int (&coding_detector_category_count);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4657

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4658 INITIALIZE_CODING_SYSTEM_TYPE (no_conversion,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4659 "no-conversion-coding-system-p");

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4660 CODING_SYSTEM_HAS_METHOD (no_conversion, convert);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4661

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4662 INITIALIZE_DETECTOR (no_conversion);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4663 DETECTOR_HAS_METHOD (no_conversion, detect);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4664 INITIALIZE_DETECTOR_CATEGORY (no_conversion, no_conversion);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4665

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4666 INITIALIZE_CODING_SYSTEM_TYPE_WITH_DATA (convert_eol,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4667 "convert-eol-coding-system-p");

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4668 CODING_SYSTEM_HAS_METHOD (convert_eol, print);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4669 CODING_SYSTEM_HAS_METHOD (convert_eol, convert);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4670 CODING_SYSTEM_HAS_METHOD (convert_eol, getprop);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4671 CODING_SYSTEM_HAS_METHOD (convert_eol, putprop);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4672 CODING_SYSTEM_HAS_METHOD (convert_eol, conversion_end_type);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4673 CODING_SYSTEM_HAS_METHOD (convert_eol, canonicalize_after_coding);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4674 CODING_SYSTEM_HAS_METHOD (convert_eol, init_coding_stream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4675

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4676 INITIALIZE_CODING_SYSTEM_TYPE_WITH_DATA (undecided,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4677 "undecided-coding-system-p");

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4678 CODING_SYSTEM_HAS_METHOD (undecided, init);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4679 CODING_SYSTEM_HAS_METHOD (undecided, mark);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4680 CODING_SYSTEM_HAS_METHOD (undecided, print);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4681 CODING_SYSTEM_HAS_METHOD (undecided, convert);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4682 CODING_SYSTEM_HAS_METHOD (undecided, putprop);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4683 CODING_SYSTEM_HAS_METHOD (undecided, getprop);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4684 CODING_SYSTEM_HAS_METHOD (undecided, init_coding_stream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4685 CODING_SYSTEM_HAS_METHOD (undecided, rewind_coding_stream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4686 CODING_SYSTEM_HAS_METHOD (undecided, finalize_coding_stream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4687 CODING_SYSTEM_HAS_METHOD (undecided, mark_coding_stream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4688 CODING_SYSTEM_HAS_METHOD (undecided, canonicalize);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4689 CODING_SYSTEM_HAS_METHOD (undecided, canonicalize_after_coding);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4690

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4691 INITIALIZE_CODING_SYSTEM_TYPE_WITH_DATA (chain, "chain-coding-system-p");

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4692

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4693 CODING_SYSTEM_HAS_METHOD (chain, print);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4694 CODING_SYSTEM_HAS_METHOD (chain, canonicalize);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4695 CODING_SYSTEM_HAS_METHOD (chain, init);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4696 CODING_SYSTEM_HAS_METHOD (chain, mark);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4697 CODING_SYSTEM_HAS_METHOD (chain, mark_coding_stream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4698 CODING_SYSTEM_HAS_METHOD (chain, convert);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4699 CODING_SYSTEM_HAS_METHOD (chain, rewind_coding_stream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4700 CODING_SYSTEM_HAS_METHOD (chain, finalize_coding_stream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4701 CODING_SYSTEM_HAS_METHOD (chain, finalize);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4702 CODING_SYSTEM_HAS_METHOD (chain, putprop);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4703 CODING_SYSTEM_HAS_METHOD (chain, getprop);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4704 CODING_SYSTEM_HAS_METHOD (chain, conversion_end_type);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4705 CODING_SYSTEM_HAS_METHOD (chain, canonicalize_after_coding);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4706

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4707 #ifdef DEBUG_XEMACS

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4708 INITIALIZE_CODING_SYSTEM_TYPE (internal, "internal-coding-system-p");

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4709 CODING_SYSTEM_HAS_METHOD (internal, convert);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4710 #endif

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4711

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4712 #ifdef HAVE_ZLIB

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4713 INITIALIZE_CODING_SYSTEM_TYPE_WITH_DATA (gzip, "gzip-coding-system-p");

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4714 CODING_SYSTEM_HAS_METHOD (gzip, conversion_end_type);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4715 CODING_SYSTEM_HAS_METHOD (gzip, convert);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4716 CODING_SYSTEM_HAS_METHOD (gzip, init);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4717 CODING_SYSTEM_HAS_METHOD (gzip, print);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4718 CODING_SYSTEM_HAS_METHOD (gzip, init_coding_stream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4719 CODING_SYSTEM_HAS_METHOD (gzip, rewind_coding_stream);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4720 CODING_SYSTEM_HAS_METHOD (gzip, putprop);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4721 CODING_SYSTEM_HAS_METHOD (gzip, getprop);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4722 #endif

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4723 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4724

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4725 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4726 reinit_coding_system_type_create (void)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4727 {

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4728 REINITIALIZE_CODING_SYSTEM_TYPE (no_conversion);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4729 REINITIALIZE_CODING_SYSTEM_TYPE (convert_eol);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4730 REINITIALIZE_CODING_SYSTEM_TYPE (undecided);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4731 REINITIALIZE_CODING_SYSTEM_TYPE (chain);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4732 #if 0

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4733 REINITIALIZE_CODING_SYSTEM_TYPE (text_file_wrapper);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4734 #endif /* 0 */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4735 #ifdef DEBUG_XEMACS

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4736 REINITIALIZE_CODING_SYSTEM_TYPE (internal);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4737 #endif

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4738 #ifdef HAVE_ZLIB

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4739 REINITIALIZE_CODING_SYSTEM_TYPE (gzip);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4740 #endif

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4741 }

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4742

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4743 void

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4744 reinit_vars_of_file_coding (void)

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4745 {

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4746 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4747

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4748 void

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4749 vars_of_file_coding (void)

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4750 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4751 reinit_vars_of_file_coding ();

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4752

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4753 /* We always have file-coding support */

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4754 Fprovide (intern ("file-coding"));

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4755

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4756 DEFVAR_LISP ("keyboard-coding-system", &Vkeyboard_coding_system /*

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4757 Coding system used for TTY keyboard input.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4758 Not used under a windowing system.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4759 */ );

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4760 Vkeyboard_coding_system = Qnil;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4761

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4762 DEFVAR_LISP ("terminal-coding-system", &Vterminal_coding_system /*

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4763 Coding system used for TTY display output.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4764 Not used under a windowing system.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4765 */ );

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4766 Vterminal_coding_system = Qnil;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4767

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4768 DEFVAR_LISP ("coding-system-for-read", &Vcoding_system_for_read /*

440

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

4769 Overriding coding system used when reading from a file or process.

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

4770 You should bind this variable with `let', but do not set it globally.

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

4771 If this is non-nil, it specifies the coding system that will be used

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

4772 to decode input on read operations, such as from a file or process.

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

4773 It overrides `buffer-file-coding-system-for-read',

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4774 `insert-file-contents-pre-hook', etc. Use those variables instead of

440

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

4775 this one for permanent changes to the environment. */ );

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4776 Vcoding_system_for_read = Qnil;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4777

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4778 DEFVAR_LISP ("coding-system-for-write",

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4779 &Vcoding_system_for_write /*

440

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

4780 Overriding coding system used when writing to a file or process.

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

4781 You should bind this variable with `let', but do not set it globally.

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

4782 If this is non-nil, it specifies the coding system that will be used

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

4783 to encode output for write operations, such as to a file or process.

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

4784 It overrides `buffer-file-coding-system', `write-region-pre-hook', etc.

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

4785 Use those variables instead of this one for permanent changes to the

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

4786 environment. */ );

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4787 Vcoding_system_for_write = Qnil;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4788

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4789 DEFVAR_LISP ("file-name-coding-system", &Vfile_name_coding_system /*

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4790 Coding system used to convert pathnames when accessing files.

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4791 */ );

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4792 Vfile_name_coding_system = Qnil;

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4793

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4794 DEFVAR_BOOL ("enable-multibyte-characters", &enable_multibyte_characters /*

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4795 Setting this has no effect. It is purely for FSF compatibility.

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4796 */ );

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4797 enable_multibyte_characters = 1;

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4798

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4799 Vchain_canonicalize_hash_table =

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4800 make_lisp_hash_table (50, HASH_TABLE_NON_WEAK, HASH_TABLE_EQUAL);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4801 staticpro (&Vchain_canonicalize_hash_table);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4802

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4803 #ifdef DEBUG_XEMACS

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4804 DEFVAR_LISP ("debug-coding-detection", &Vdebug_coding_detection /*

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4805 If non-nil, display debug information about detection operations in progress.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4806 Information is displayed on stderr.

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4807 */ );

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4808 Vdebug_coding_detection = Qnil;

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4809 #endif

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4810 }

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4811

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4812 void

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4813 complex_vars_of_file_coding (void)

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4814 {

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4815 Fmake_coding_system

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4816 (Qconvert_eol_cr, Qconvert_eol,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4817 build_msg_string ("Convert CR to LF"),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4818 nconc2 (list6 (Qdocumentation,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4819 build_msg_string (

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4820 "Converts CR (used to mark the end of a line on Macintosh systems) to LF\n"

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4821 "(used internally and under Unix to mark the end of a line)."),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4822 Qmnemonic, build_string ("CR->LF"),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4823 Qsubtype, Qcr),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4824 /* VERY IMPORTANT! Tell make-coding-system not to generate

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4825 subsidiaries -- it needs the coding systems we're creating

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4826 to do so! */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4827 list2 (Qeol_type, Qlf)));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4828

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4829 Fmake_coding_system

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4830 (Qconvert_eol_lf, Qconvert_eol,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4831 build_msg_string ("Convert LF to LF (do nothing)"),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4832 nconc2 (list6 (Qdocumentation,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4833 build_msg_string (

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4834 "Do nothing."),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4835 Qmnemonic, build_string ("LF->LF"),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4836 Qsubtype, Qlf),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4837 /* VERY IMPORTANT! Tell make-coding-system not to generate

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4838 subsidiaries -- it needs the coding systems we're creating

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4839 to do so! */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4840 list2 (Qeol_type, Qlf)));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4841

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4842 Fmake_coding_system

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4843 (Qconvert_eol_crlf, Qconvert_eol,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4844 build_msg_string ("Convert CRLF to LF"),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4845 nconc2 (list6 (Qdocumentation,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4846 build_msg_string (

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4847 "Converts CR+LF (used to mark the end of a line on Macintosh systems) to LF\n"

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4848 "(used internally and under Unix to mark the end of a line)."),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4849 Qmnemonic, build_string ("CRLF->LF"),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4850 Qsubtype, Qcrlf),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4851 /* VERY IMPORTANT! Tell make-coding-system not to generate

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4852 subsidiaries -- it needs the coding systems we're creating

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4853 to do so! */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4854 list2 (Qeol_type, Qlf)));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4855

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4856 Fmake_coding_system

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4857 (Qconvert_eol_autodetect, Qconvert_eol,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4858 build_msg_string ("Autodetect EOL type"),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4859 nconc2 (list6 (Qdocumentation,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4860 build_msg_string (

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4861 "Autodetect the end-of-line type."),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4862 Qmnemonic, build_string ("Auto-EOL"),

793

e38acbeb1cae [xemacs-hg @ 2002-03-29 04:46:17 by ben]

ben

parents: 778

diff changeset

4863 Qsubtype, Qnil),

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4864 /* VERY IMPORTANT! Tell make-coding-system not to generate

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4865 subsidiaries -- it needs the coding systems we're creating

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4866 to do so! */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4867 list2 (Qeol_type, Qlf)));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4868

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4869 Fmake_coding_system

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4870 (Qundecided, Qundecided,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4871 build_msg_string ("Undecided (auto-detect)"),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4872 nconc2 (list4 (Qdocumentation,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4873 build_msg_string

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4874 ("Automatically detects the correct encoding."),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4875 Qmnemonic, build_string ("Auto")),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4876 list6 (Qdo_eol, Qt, Qdo_coding, Qt,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4877 /* We do EOL detection ourselves so we don't need to be

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4878 wrapped in an EOL detector. (It doesn't actually hurt,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4879 though, I don't think.) */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4880 Qeol_type, Qlf)));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4881

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4882 Fmake_coding_system

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4883 (intern ("undecided-dos"), Qundecided,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4884 build_msg_string ("Undecided (auto-detect) (CRLF)"),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4885 nconc2 (list4 (Qdocumentation,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4886 build_msg_string

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4887 ("Automatically detects the correct encoding; EOL type of CRLF forced."),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4888 Qmnemonic, build_string ("Auto")),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4889 list4 (Qdo_coding, Qt,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4890 Qeol_type, Qcrlf)));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4891

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4892 Fmake_coding_system

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4893 (intern ("undecided-unix"), Qundecided,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4894 build_msg_string ("Undecided (auto-detect) (LF)"),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4895 nconc2 (list4 (Qdocumentation,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4896 build_msg_string

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4897 ("Automatically detects the correct encoding; EOL type of LF forced."),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4898 Qmnemonic, build_string ("Auto")),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4899 list4 (Qdo_coding, Qt,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4900 Qeol_type, Qlf)));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4901

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4902 Fmake_coding_system

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4903 (intern ("undecided-mac"), Qundecided,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4904 build_msg_string ("Undecided (auto-detect) (CR)"),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4905 nconc2 (list4 (Qdocumentation,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4906 build_msg_string

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4907 ("Automatically detects the correct encoding; EOL type of CR forced."),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4908 Qmnemonic, build_string ("Auto")),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4909 list4 (Qdo_coding, Qt,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4910 Qeol_type, Qcr)));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4911

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4912 /* Need to create this here or we're really screwed. */

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4913 Fmake_coding_system

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4914 (Qraw_text, Qno_conversion,

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4915 build_msg_string ("Raw Text"),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4916 list4 (Qdocumentation,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4917 build_msg_string ("Raw text converts only line-break codes, and acts otherwise like `binary'."),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4918 Qmnemonic, build_string ("Raw")));

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4919

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4920 Fmake_coding_system

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4921 (Qbinary, Qno_conversion,

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4922 build_msg_string ("Binary"),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4923 list6 (Qdocumentation,

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4924 build_msg_string (

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4925 "This coding system is as close as it comes to doing no conversion.\n"

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4926 "On input, each byte is converted directly into the character\n"

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4927 "with the corresponding code -- i.e. from the `ascii', `control-1',\n"

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4928 "or `latin-1' character sets. On output, these characters are\n"

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4929 "converted back to the corresponding bytes, and other characters\n"

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4930 "are converted to the default character, i.e. `~'."),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4931 Qeol_type, Qlf,

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4932 Qmnemonic, build_string ("Binary")));

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4933

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4934 /* Formerly aliased to raw-text! Completely bogus and not even the same

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4935 as FSF Emacs. */

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4936 Fdefine_coding_system_alias (Qno_conversion, Qbinary);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4937 Fdefine_coding_system_alias (intern ("no-conversion-unix"),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4938 intern ("raw-text-unix"));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4939 Fdefine_coding_system_alias (intern ("no-conversion-dos"),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4940 intern ("raw-text-dos"));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4941 Fdefine_coding_system_alias (intern ("no-conversion-mac"),

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4942 intern ("raw-text-mac"));

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4943

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4944 /* These four below will get their defaults set correctly in

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4945 code-init.el. We init them now so we can handle stuff at dump

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4946 time before we get to code-init.el. */

440

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

4947 Fdefine_coding_system_alias (Qfile_name, Qbinary);

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4948 Fdefine_coding_system_alias (Qnative, Qfile_name);

440

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

4949

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

4950 Fdefine_coding_system_alias (Qterminal, Qbinary);

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

4951 Fdefine_coding_system_alias (Qkeyboard, Qbinary);

8de8e3f6228a Import from CVS: tag r21-2-28

cvs

parents: 438

diff changeset

4952

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4953 Fdefine_coding_system_alias (Qidentity, Qconvert_eol_lf);

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4954

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4955 /* Need this for bootstrapping */

771

943eaba38521 [xemacs-hg @ 2002-03-13 08:51:24 by ben]

ben

parents: 665

diff changeset

4956 coding_category_system[detector_category_no_conversion] =

428

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4957 Fget_coding_system (Qraw_text);

3ecd8885ac67 Import from CVS: tag r21-2-22

cvs

parents:

diff changeset

4958 }

Mercurial > hg > xemacs-beta

annotate src/file-coding.c @ 1069:13daf40fb997