author: tkikuchi 2007-03-24 05:17:00 +0000
committer: tkikuchi 2007-03-24 05:17:00 +0000
commit: 8b83e896dfdbf349190fc9e70a258221907b7a84 (patch)
tree: 56a19a5da94240bfff5f0e91c67b381e4f97b24a
parent: cd3c500449c1c4d0ff7a9e1710c3bedd81c6a804 (diff)
download: mailman-8b83e896dfdbf349190fc9e70a258221907b7a84.tar.gz
mailman-8b83e896dfdbf349190fc9e70a258221907b7a84.tar.zst
mailman-8b83e896dfdbf349190fc9e70a258221907b7a84.zip
2 files changed, 52 insertions, 16 deletions
diff --git a/Mailman/Handlers/ToDigest.py b/Mailman/Handlers/ToDigest.py
index e43cb68ce..17ea2f89b 100644
--- a/Mailman/Handlers/ToDigest.py
+++ b/Mailman/Handlers/ToDigest.py
@@ -31,7 +31,7 @@ import copy
 import time
 import logging
 
-from StringIO import StringIO
+from StringIO import StringIO          # cStringIO can't handle unicode.
 from email.Charset import Charset
 from email.Generator import Generator
 from email.Header import decode_header, make_header, Header
@@ -163,8 +163,6 @@ def send_i18n_digests(mlist, mboxfp):
     mimemsg['Message-ID'] = Utils.unique_message_id(mlist)
     # Set things up for the rfc1153 digest
     plainmsg = StringIO()
-    # cStringIO doesn't have encoding. Sigh.
-    plainmsg.encoding = 'utf-8'
     rfc1153msg = Message.Message()
     rfc1153msg['From'] = mlist.GetRequestEmail()
     rfc1153msg['Subject'] = digestsubj
@@ -211,7 +209,6 @@ def send_i18n_digests(mlist, mboxfp):
     #
     # Meanwhile prepare things for the table of contents
     toc = StringIO()
-    toc.encoding = 'utf-8'
     print >> toc, _("Today's Topics:\n")
     # Now cruise through all the messages in the mailbox of digest messages,
     # building the MIME payload and core of the RFC 1153 digest.  We'll also
@@ -292,7 +289,10 @@ def send_i18n_digests(mlist, mboxfp):
         return
     toctext = toc.getvalue()
     # MIME
-    tocpart = MIMEText(toctext.encode(lcset), _charset=lcset)
+    try:
+        tocpart = MIMEText(toctext.encode(lcset), _charset=lcset)
+    except UnicodeError:
+        tocpart = MIMEText(toctext.encode('utf-8'), _charset='utf-8')
     tocpart['Content-Description']= _("Today's Topics ($msgcount messages)")
     mimemsg.attach(tocpart)
     # RFC 1153
@@ -333,16 +333,12 @@ def send_i18n_digests(mlist, mboxfp):
         # -- just stringfy it.
         payload = msg.get_payload(decode=True) \
                   or msg.as_string().split('\n\n',1)[1]
-        mcset = msg.get_content_charset('')
-        if mcset and mcset <> lcset and mcset <> lcset_out:
-            try:
-                payload = unicode(payload, mcset, 'replace'
-                          ).encode(lcset, 'replace')
-            except (UnicodeError, LookupError):
-                # TK: Message has something unknown charset.
-                #     _out means charset in 'outer world'.
-                payload = unicode(payload, lcset_out, 'replace'
-                          ).encode(lcset, 'replace')
+        mcset = msg.get_content_charset('us-ascii')
+        try:
+            payload = unicode(payload, mcset, 'replace')
+        except (LookupError, TypeError):
+            # unknown or empty charset
+            payload = unicode(payload, 'us-ascii', 'replace')
         print >> plainmsg, payload
         if not payload.endswith('\n'):
             print >> plainmsg
@@ -403,7 +399,12 @@ def send_i18n_digests(mlist, mboxfp):
                     listname=mlist.fqdn_listname,
                     isdigest=True)
     # RFC 1153
-    rfc1153msg.set_payload(plainmsg.getvalue().encode(lcset), lcset)
+    # If the entire digest message can't be encoded by list charset, fall
+    # back to 'utf-8'.
+    try:
+        rfc1153msg.set_payload(plainmsg.getvalue().encode(lcset), lcset)
+    except UnicodeError:
+        rfc1153msg.set_payload(plainmsg.getvalue().encode('utf-8'), 'utf-8')
     virginq.enqueue(rfc1153msg,
                     recips=plainrecips,
                     listname=mlist.fqdn_listname,
diff --git a/Mailman/testing/test_handlers.py b/Mailman/testing/test_handlers.py
index 64a6e409b..931a7ca44 100644
--- a/Mailman/testing/test_handlers.py
+++ b/Mailman/testing/test_handlers.py
@@ -1606,6 +1606,41 @@ Here is message %(i)d
         # BAW: this test is incomplete...
 
 
+    def test_send_i18n_digest(self):
+        eq = self.assertEqual
+        mlist = self._mlist
+	mlist.preferred_language = 'fr'
+        msg = email.message_from_string("""\
+From: aperson@example.org
+To: _xtest@example.com
+Subject: =?iso-2022-jp?b?GyRCMGxIVhsoQg==?=
+MIME-Version: 1.0
+Content-Type: text/plain; charset=iso-2022-jp
+Content-Transfer-Encoding: 7bit
+
+\x1b$B0lHV\x1b(B
+""")
+        mlist.digest_size_threshhold = 0
+        ToDigest.process(mlist, msg, {})
+	files = self._sb.files()
+        eq(len(files), 2)
+        for filebase in files:
+	    qmsg, qdata = self._sb.dequeue(filebase)
+            if qmsg.get_content_maintype() == 'multipart':
+                mimemsg = qmsg
+                mimedata = qdata
+            else:
+                rfc1153msg = qmsg
+                rfc1153data = qdata
+	eq(rfc1153msg.get_content_type(), 'text/plain')
+	eq(rfc1153msg.get_content_charset(), 'utf-8')
+	eq(rfc1153msg['content-transfer-encoding'], 'base64')
+	toc = mimemsg.get_payload()[1]
+	eq(toc.get_content_type(), 'text/plain')
+	eq(toc.get_content_charset(), 'utf-8')
+	eq(toc['content-transfer-encoding'], 'base64')
+
+
 
 class TestToOutgoing(TestBase):
     def setUp(self):
author	tkikuchi	2007-03-24 05:17:00 +0000
committer	tkikuchi	2007-03-24 05:17:00 +0000
commit	8b83e896dfdbf349190fc9e70a258221907b7a84 (patch)
tree	56a19a5da94240bfff5f0e91c67b381e4f97b24a
parent	cd3c500449c1c4d0ff7a9e1710c3bedd81c6a804 (diff)
download	mailman-8b83e896dfdbf349190fc9e70a258221907b7a84.tar.gz mailman-8b83e896dfdbf349190fc9e70a258221907b7a84.tar.zst mailman-8b83e896dfdbf349190fc9e70a258221907b7a84.zip